llm-concepts

Chain of Thought

Chain-of-thought: cho AI nháp trước khi chốt

Độ khóbeginner

Cửa hàng dán bảng 'giảm 20%, thêm 10% tại quầy thanh toán'. Tổng cộng bạn được giảm bao nhiêu phần trăm so với giá gốc?

Hãy nhớ thời đi học: cô giáo luôn dặn “trình bày bài giải, đừng chỉ viết mỗi đáp án”. Em nào nhảy thẳng đến kết quả cuối rất hay sai ở bài nhiều bước, còn em nào chịu khó viết từng dòng lại thường đúng, dù chưa phải giỏi nhất. Chain-of-Thought làm đúng việc đó với AI: yêu cầu AI viết nháp trước khi kết luận.

Một cách so sánh khác: khi luật sư tranh luận trước toà, họ không nhảy thẳng đến câu “thân chủ tôi vô tội”. Họ dẫn dắt từng mắt xích, chứng cứ A, nhân chứng B, tình tiết C, rồi mới chốt. Nhờ đó toà (và cả chính họ) có cơ hội phát hiện chỗ lỏng lẻo trước khi quyết định. AI cũng vậy: càng đi qua nhiều mắt xích đúng, xác suất đáp án cuối đúng càng cao.

Trong công việc văn phòng, “nhiều mắt xích” xuất hiện ở khắp nơi: tính công nợ qua nhiều kỳ, so sánh 3 hợp đồng, viết báo cáo nhiều đề mục, lên lịch họp có ràng buộc. Bạn càng ép AI trình bày nháp, mức kiểm soát của bạn càng cao, và sai sót giảm rõ rệt.

Hình minh họa

1Demo 1, Nhanh vs. nháp kỹ

So sánh câu trả lời trực tiếp vs. từng bước

Cùng một câu hỏi, bật giữa hai chế độ “câu trả lời trực tiếp” và “suy nghĩ từng bước”. Bạn sẽ thấy một pattern rất rõ: kiểu trả lời nhanh hay sai ở những tình huống nhiều bước thường gặp.

Cửa hàng dán bảng: giảm 20%, rồi tới quầy thu ngân giảm thêm 10% trên giá đã giảm. Tổng cộng bạn được giảm bao nhiêu phần trăm so với giá gốc?

Bấm thử hai chế độ để thấy AI khác nhau đến mức nào khi có thời gian 'nháp'.

SaiAI trả lời trong 1 nhịp

30%

AI cộng đại hai con số 20% và 10% → ra 30%. Nghe hợp lý, nhưng sai về bản chất.

Thử đổi tab ở trên

Bấm ba tình huống “Khuyến mãi chồng”, “Sắp phòng họp”, “Hoàn thuế VAT” rồi toggle giữa hai chế độ. AI đều sai khi trả lời nhanh và đều đúng khi được “nháp”.

2Demo 2, Bạn tự xếp các bước

Tự xếp các bước suy luận

Tình huống: bạn được sếp giao so sánh ba nhà cung cấp A, B, C rồi đề xuất chọn một bên. Các bước dưới đây đang bị xáo. Hãy kéo thả để xếp lại đúng thứ tự một chuỗi suy luận lành mạnh.

Kéo thả để sắp xếp 5 bước so sánh nhà cung cấp theo thứ tự đúng.

Chốt chọn một nhà cung cấp và viết lý do

Liệt kê các tiêu chí quan trọng cho tình huống của mình

Chấm điểm từng nhà cung cấp trên từng tiêu chí

Cộng tổng điểm và xếp hạng ba nhà cung cấp

Thu thập thông tin ba nhà cung cấp vào một bảng

Ghi nhớ

Một chuỗi suy luận tốt luôn đi từ thu thập → xác định tiêu chí → chấm điểm → tổng hợp → kết luận. Bạn có thể dán nguyên thứ tự này vào prompt để AI bám theo.

3Demo 3, Hai mẫu prompt

Hai mẫu prompt cho cùng một câu hỏi

Cùng một câu hỏi tính phụ cấp. Chỉ cần thêm một câu dặn “hãy liệt kê từng khoản rồi cộng lại”, câu trả lời của AI đã kiểm được rõ ràng và bạn có thể đối chiếu với Excel trong 5 giây.

Cùng một câu hỏi về phụ cấp, chỉ thay đổi vài câu trong prompt, chất lượng câu trả lời đã rất khác.

Prompt bạn viết

“Nhân viên thử việc có lương cứng 8 triệu, phụ cấp ăn trưa 730.000, phụ cấp điện thoại 300.000. Tính tổng thu nhập.”

AI trả lời

“Tổng thu nhập khoảng 9 triệu.”
Tròn số, không thấy rõ AI tính gì, bạn không kiểm được.

Chain-of-Thought không làm AI thông minh hơn, nó cho AI thời gian để suy nghĩ. Khi bạn bắt AI viết nháp từng bước, mỗi bước trung gian trở thành gợi ý cho bước tiếp theo. Cũng một mô hình đó, nhưng được phép trình bày lời giải, tỉ lệ đúng tăng rõ rệt, đặc biệt ở những việc văn phòng có nhiều mắt xích.

Công việc nào SAU ĐÂY sẽ hưởng lợi NHIỀU NHẤT khi bạn thêm 'Hãy suy nghĩ từng bước' vào prompt?

Giải thích

Chain-of-Thought là một kỹ thuật viết prompt, KHÔNG phải là một tính năng của AI. Bạn có thể áp dụng ngay với ChatGPT, Claude, Gemini hay bất cứ trợ lý AI nào bạn đang dùng mà không cần cài thêm gì. Chỉ là cách đặt câu hỏi khác đi một chút.

Ý tưởng cốt lõi rất gọn: thay vì hỏi “Đáp án là gì?”, bạn yêu cầu AI viết nháp từng bước trước khi ra đáp án. Khi các bước trung gian hiện ra, bạn có thể đọc qua, phát hiện chỗ AI nhầm, và yêu cầu sửa, giống như đọc bài làm của một nhân viên thực tập.

Khi nào CoT toả sáng

Tính lương thưởng nhiều khoản

Nhiều bước, rất dễ sai nếu cộng gộp.

Lên lịch 5 cuộc họp trong 1 ngày

Có ràng buộc thời gian và người, cần nháp.

So sánh 3 nhà cung cấp

Cần chấm điểm từng tiêu chí.

Viết một lời chào email

Một câu đơn giản, thêm chuỗi suy luận chỉ tốn thời gian.

Hỏi thủ đô nước Pháp

Câu hỏi tra cứu, AI chỉ cần nhớ, không cần suy luận.

Dịch 1 câu tiếng Anh

Việc 1 bước, đừng bắt AI nháp dài dòng.

Hai biến thể bạn nên biết. Trong tài liệu AI tiếng Anh, người ta phân biệt hai cách dùng CoT phổ biến:

Zero-shot CoTKhông ví dụ mẫu

Chỉ cần thêm một câu thần chú vào cuối prompt. Đơn giản nhất, phù hợp cho 90% tình huống hàng ngày của dân văn phòng.

“…[câu hỏi của bạn]. Hãy suy nghĩ từng bước trước khi trả lời.”

Few-shot CoTKèm 1–2 ví dụ mẫu

Bạn cho AI thấy trước một bài mẫu đã trình bày theo đúng style bạn muốn. Dùng khi bạn cần định dạng cố định (bảng, form, mẫu email).

“Ví dụ: câu hỏi X → nháp 3 bước → đáp án Y.
Bây giờ đến câu của tôi: [câu hỏi thật]. Hãy làm theo đúng mẫu trên.”

Mức cải thiện cụ thể ra sao? Thí nghiệm công khai trên nhiều mô hình lớn (GPT, Claude, Gemini) đều cho thấy cùng một pattern: chỉ cần đổi cách hỏi, độ chính xác trên bài nhiều bước có thể tăng từ khoảng một phần ba lên hơn hai phần ba.

Hỏi thẳng, không gợi suy luận34%

AI đoán cảm tính, dễ lạc đề ở bài nhiều bước.

Zero-shot CoT, thêm câu 'suy nghĩ từng bước'62%

Chỉ đổi vài chữ trong prompt đã tăng gần gấp đôi độ đúng.

Few-shot CoT, có ví dụ mẫu đã trình bày rõ78%

Đỉnh nhất khi bạn cần format cố định (bảng, email mẫu, báo cáo).

Con số minh họa, tổng hợp từ các thử nghiệm công khai trên bài toán nhiều bước. Với tác vụ văn phòng cụ thể của bạn, mức cải thiện thực tế có thể khác.

Ghép đôi thuật ngữ. Để ghi nhớ, hãy nối mỗi khái niệm bên trái với định nghĩa bên phải.

Nối mỗi thuật ngữ với định nghĩa đúng, thực hành phản xạ trước khi vào quiz.

Cột A

Cột B

Điền vào chỗ trống để chốt lại công thức viết prompt hiệu quả:

Để AI trả lời tốt hơn ở việc nhiều bước, hãy yêu cầu AI rồi mới , và tránh dùng kỹ thuật này cho câu hỏi .

Cảnh báo chi phí – thời gian

Chain-of-Thought làm câu trả lời dài hơn, nên AI cũng tính nhiều token hơn (với bản trả phí) và đợi lâu hơn vài giây. Chỉ bật CoT cho những việc thực sự nhiều bước. Với câu hỏi đơn giản, cứ hỏi thẳng, AI sẽ trả nhanh và rẻ.

Trong thực tế. Một số công cụ AI đã tự bật chuỗi suy luận bên trong mà không cần bạn nhắc, ví dụ GPT-o1 và chế độ “Extended Thinking” của Claude. Với các mô hình thường, bạn vẫn cần tự chủ động nhắc. Dù ở trường hợp nào, hiểu Chain-of-Thought giúp bạn biết lúc nào nên chờ AI “nháp kỹ” và lúc nào nên bảo AI “ngắn gọn thôi”.

Ghi nhớ 5 điều về Chain-of-Thought

Chain-of-Thought là cách ĐẶT CÂU HỎI, bắt AI viết nháp từng bước thay vì nhảy thẳng tới đáp án.
Dùng khi việc có nhiều bước: lương thưởng, thuế, so sánh lựa chọn, lên lịch, báo cáo nhiều đề mục.
Không dùng cho câu hỏi một bước như chào hỏi, tra cứu, dịch câu ngắn, sẽ tốn thời gian vô ích.
Zero-shot CoT: thêm câu 'Hãy suy nghĩ từng bước'. Few-shot CoT: kèm 1–2 ví dụ mẫu theo đúng format bạn muốn.
Đánh đổi: câu trả lời dài hơn, tốn token hơn, đợi lâu hơn, nhưng đúng hơn ở những việc nhiều mắt xích.

Kiểm tra hiểu biết

Câu 1/6

Chain-of-Thought (chuỗi suy luận từng bước) giúp ích NHIỀU NHẤT ở loại công việc nào?

Chủ đề liên quan

Prompt Engineering: Prompt engineering: biến yêu cầu thành spec Reasoning Models: Mô hình suy luận. AI biết nghĩ sâu In-Context Learning: In-context learning: dạy AI bằng vài ví dụ