Operator 2 — agent và người cùng điều khiển một tab
OpenAI cho agent và người dùng chung một trình duyệt: cùng cursor, cùng tab, cùng form. Mỗi hành động có hậu quả đều phải có xác nhận từ người trước khi chạy.
OpenAI ra Operator 2 — bản kế thừa trình duyệt của agent đầu 2025. Khác biệt lớn nhất: người và agent dùng chung một tab. Không phải agent chạy trong iframe ẩn rồi báo lại, mà cùng cursor, cùng input, cùng session cookie.
Lý do thiết kế: workflow thật của người dùng thường chen giữa — điền form, bấm OK, xác nhận OTP. Agent trước đây hoặc chạy một mạch (rồi sai), hoặc dừng để chờ người (rồi mất context). Operator 2 chọn ở giữa.
Mỗi hành động có hậu quả đều phải có người gật đầu
Operator 2 chia hành động thành 3 mức:
| Tier | Ví dụ | Guardrail |
|---|---|---|
| Tự do | click link, scroll, đọc nội dung, copy text, chuyển tab | Không cần |
| Có cảnh báo | điền form, submit search, upload file, chuyển URL domain | Banner ở header · người có 3 giây ngắt |
| Phải xác nhận | payment, xoá tài khoản, OTP, chuyển tiền, gửi email ra ngoài | Modal chặn · người click Cho phép |
Ranh giới không do model tự đoán — có danh sách rõ ràng: form payment, xoá tài khoản, reset password, chuyển tiền, gửi email ra ngoài. Ngoài danh sách đó, agent cứ chạy.
Cách này đánh đổi giữa “autonomous” và “safe”: agent architecture kiểu này chậm hơn, nhưng user-trust kéo dài hơn — không phải hỏng 1 lần là tắt vĩnh viễn.
Agent headless → Agent đồng-điều khiển
Agent mở trình duyệt ẩn, dùng toàn bộ thao tác. Người xem log sau. Sai là phải quay lại từ đầu.
Cùng tab. Người thấy cursor agent di chuyển, có thể ngắt bất kỳ lúc nào. Confirm gate ở mọi hành động nhạy cảm.
Điểm khác mà ít được nói: Operator 2 không yêu cầu extension riêng. Chạy trên Chrome/Arc/Safari thẳng qua CDP (Chrome DevTools Protocol). Nghĩa là doanh nghiệp không cần deploy image mới.
Task lặp đi lặp lại + có audit trail + có confirm gate
Sweet spot là những task kiểu: tra cứu 30 email đặt vé, download 50 invoice từ portal khách hàng, sort inbox theo nguyên tắc, reply theo template có biến. Những việc nhàm chán nhưng không được phép sai.
Không hợp cho: giao dịch ngân hàng, đặt vé máy bay (nhiều confirm gate), hoặc bất kỳ quy trình nào cần judgment phức tạp — vì mỗi lần confirm là một lần bị người chặn, thời gian tiết kiệm tụt nhanh.