Chain of Thought
Chuỗi suy luận từng bước
Cửa hàng dán bảng 'giảm 20%, thêm 10% tại quầy thanh toán'. Tổng cộng bạn được giảm bao nhiêu phần trăm so với giá gốc?
Hãy nhớ thời đi học: cô giáo luôn dặn “trình bày bài giải, đừng chỉ viết mỗi đáp án”. Em nào nhảy thẳng đến kết quả cuối rất hay sai ở bài nhiều bước, còn em nào chịu khó viết từng dòng lại thường đúng, dù chưa phải giỏi nhất. Chain-of-Thought làm đúng việc đó với AI: yêu cầu AI viết nháp trước khi kết luận.
Một cách so sánh khác: khi luật sư tranh luận trước toà, họ không nhảy thẳng đến câu “thân chủ tôi vô tội”. Họ dẫn dắt từng mắt xích — chứng cứ A, nhân chứng B, tình tiết C — rồi mới chốt. Nhờ đó toà (và cả chính họ) có cơ hội phát hiện chỗ lỏng lẻo trước khi quyết định. AI cũng vậy: càng đi qua nhiều mắt xích đúng, xác suất đáp án cuối đúng càng cao.
Trong công việc văn phòng, “nhiều mắt xích” xuất hiện ở khắp nơi: tính công nợ qua nhiều kỳ, so sánh 3 hợp đồng, viết báo cáo nhiều đề mục, lên lịch họp có ràng buộc. Bạn càng ép AI trình bày nháp, mức kiểm soát của bạn càng cao — và sai sót giảm rõ rệt.
Hình minh họa
Cùng một câu hỏi, bật giữa hai chế độ “câu trả lời trực tiếp” và “suy nghĩ từng bước”. Bạn sẽ thấy một pattern rất rõ: kiểu trả lời nhanh hay sai ở những tình huống nhiều bước thường gặp.
Cửa hàng dán bảng: giảm 20%, rồi tới quầy thu ngân giảm thêm 10% trên giá đã giảm. Tổng cộng bạn được giảm bao nhiêu phần trăm so với giá gốc?
Bấm thử hai chế độ để thấy AI khác nhau đến mức nào khi có thời gian 'nháp'.
30%
AI cộng đại hai con số 20% và 10% → ra 30%. Nghe hợp lý, nhưng sai về bản chất.
Tình huống: bạn được sếp giao so sánh ba nhà cung cấp A, B, C rồi đề xuất chọn một bên. Các bước dưới đây đang bị xáo. Hãy kéo thả để xếp lại đúng thứ tự một chuỗi suy luận lành mạnh.
Kéo thả để sắp xếp 5 bước so sánh nhà cung cấp theo thứ tự đúng.
Cùng một câu hỏi tính phụ cấp. Chỉ cần thêm một câu dặn “hãy liệt kê từng khoản rồi cộng lại”, câu trả lời của AI đã kiểm được rõ ràng và bạn có thể đối chiếu với Excel trong 5 giây.
Cùng một câu hỏi về phụ cấp — chỉ thay đổi vài câu trong prompt, chất lượng câu trả lời đã rất khác.
Prompt bạn viết
“Nhân viên thử việc có lương cứng 8 triệu, phụ cấp ăn trưa 730.000, phụ cấp điện thoại 300.000. Tính tổng thu nhập.”
AI trả lời
“Tổng thu nhập khoảng 9 triệu.”
Tròn số, không thấy rõ AI tính gì — bạn không kiểm được.
Công việc nào SAU ĐÂY sẽ hưởng lợi NHIỀU NHẤT khi bạn thêm 'Hãy suy nghĩ từng bước' vào prompt?
Giải thích
Chain-of-Thought là một kỹ thuật viết prompt — KHÔNG phải là một tính năng của AI. Bạn có thể áp dụng ngay với ChatGPT, Claude, Gemini hay bất cứ trợ lý AI nào bạn đang dùng mà không cần cài thêm gì. Chỉ là cách đặt câu hỏi khác đi một chút.
Ý tưởng cốt lõi rất gọn: thay vì hỏi “Đáp án là gì?”, bạn yêu cầu AI viết nháp từng bước trước khi ra đáp án. Khi các bước trung gian hiện ra, bạn có thể đọc qua, phát hiện chỗ AI nhầm, và yêu cầu sửa — giống như đọc bài làm của một nhân viên thực tập.
Khi nào CoT toả sáng
Tính lương thưởng nhiều khoản
Nhiều bước — rất dễ sai nếu cộng gộp.
Lên lịch 5 cuộc họp trong 1 ngày
Có ràng buộc thời gian và người — cần nháp.
So sánh 3 nhà cung cấp
Cần chấm điểm từng tiêu chí.
Viết một lời chào email
Một câu đơn giản — thêm chuỗi suy luận chỉ tốn thời gian.
Hỏi thủ đô nước Pháp
Câu hỏi tra cứu — AI chỉ cần nhớ, không cần suy luận.
Dịch 1 câu tiếng Anh
Việc 1 bước — đừng bắt AI nháp dài dòng.
Hai biến thể bạn nên biết. Trong tài liệu AI tiếng Anh, người ta phân biệt hai cách dùng CoT phổ biến:
Chỉ cần thêm một câu thần chú vào cuối prompt. Đơn giản nhất, phù hợp cho 90% tình huống hàng ngày của dân văn phòng.
Bạn cho AI thấy trước một bài mẫu đã trình bày theo đúng style bạn muốn. Dùng khi bạn cần định dạng cố định (bảng, form, mẫu email).
Bây giờ đến câu của tôi: [câu hỏi thật]. Hãy làm theo đúng mẫu trên.”
Mức cải thiện cụ thể ra sao? Thí nghiệm công khai trên nhiều mô hình lớn (GPT, Claude, Gemini) đều cho thấy cùng một pattern: chỉ cần đổi cách hỏi, độ chính xác trên bài nhiều bước có thể tăng từ khoảng một phần ba lên hơn hai phần ba.
AI đoán cảm tính, dễ lạc đề ở bài nhiều bước.
Chỉ đổi vài chữ trong prompt đã tăng gần gấp đôi độ đúng.
Đỉnh nhất khi bạn cần format cố định (bảng, email mẫu, báo cáo).
Con số minh họa — tổng hợp từ các thử nghiệm công khai trên bài toán nhiều bước. Với tác vụ văn phòng cụ thể của bạn, mức cải thiện thực tế có thể khác.
Ghép đôi thuật ngữ. Để ghi nhớ, hãy nối mỗi khái niệm bên trái với định nghĩa bên phải.
Nối mỗi thuật ngữ với định nghĩa đúng — thực hành phản xạ trước khi vào quiz.
Cột A
Cột B
Điền vào chỗ trống để chốt lại công thức viết prompt hiệu quả:
Trong thực tế. Một số công cụ AI đã tự bật chuỗi suy luận bên trong mà không cần bạn nhắc — ví dụ GPT-o1 và chế độ “Extended Thinking” của Claude. Với các mô hình thường, bạn vẫn cần tự chủ động nhắc. Dù ở trường hợp nào, hiểu Chain-of-Thought giúp bạn biết lúc nào nên chờ AI “nháp kỹ” và lúc nào nên bảo AI “ngắn gọn thôi”.
- Chain-of-Thought là cách ĐẶT CÂU HỎI — bắt AI viết nháp từng bước thay vì nhảy thẳng tới đáp án.
- Dùng khi việc có nhiều bước: lương thưởng, thuế, so sánh lựa chọn, lên lịch, báo cáo nhiều đề mục.
- Không dùng cho câu hỏi một bước như chào hỏi, tra cứu, dịch câu ngắn — sẽ tốn thời gian vô ích.
- Zero-shot CoT: thêm câu 'Hãy suy nghĩ từng bước'. Few-shot CoT: kèm 1–2 ví dụ mẫu theo đúng format bạn muốn.
- Đánh đổi: câu trả lời dài hơn, tốn token hơn, đợi lâu hơn — nhưng đúng hơn ở những việc nhiều mắt xích.
Kiểm tra hiểu biết
Chain-of-Thought (chuỗi suy luận từng bước) giúp ích NHIỀU NHẤT ở loại công việc nào?