Large Language Models
LLM
Bạn gõ vào ChatGPT: 'Soạn giúp tôi email xin nghỉ phép 3 ngày'. Theo bạn, trong đầu máy đang diễn ra chuyện gì?
Hình dung một bác bán phở Bát Đàn đứng ba mươi năm ở góc phố. Khách vừa bước vào, chưa kịp ngồi xuống bác đã biết hôm nay khách gọi tái gầu hay chín nạm, có dưa muối hay không. Bác không đọc được ý nghĩ ai cả — bác chỉ đã nhìn hàng chục vạn lượt khách, nên bộ não bác nắm được một quy luật mỏng manh nhưng đáng tin: người mặc sơ mi, đi xe tay ga, vào lúc 7 giờ sáng thường gọi cái gì.
LLM chính là bác bán phở đó, phóng to lên hàng triệu lần. Nó đã đọc gần như toàn bộ Internet, sách, báo, diễn đàn, email công khai... Khi bạn bắt đầu gõ một câu, nó nhìn các chữ đã có, dò lại ký ức khổng lồ ấy, rồi đoán chữ tiếp theo nào hợp vai nhất. Đó là toàn bộ phép thuật, không có gì hơn.
Điều hay là: vì đã đọc quá nhiều, nó biết văn phong email công sở khác văn tin nhắn bạn bè, biết câu trong biên bản họp không giống câu trong caption Tiktok. Điều đáng sợ là: khi không biết, nó vẫn đoán một cách tự tin — đôi khi bịa ra điều luật, tên sách, trích dẫn không tồn tại. Dùng LLM ở công việc nghĩa là học cách phát huy ưu thế và cảnh giác với điểm yếu đó.
Hình minh họa
Bạn là LLM: đoán chữ sắp gõ tiếp theo
Chọn một tình huống văn phòng. Máy đang đứng trước câu hỏi: “chữ nào hợp nhất để gõ tiếp?” Mỗi thanh là xác suất máy dành cho từng ứng viên.
Kính gửi anh Minh, em viết email này để xin phép nghỉ
Xanh lá = chữ an toàn (nghĩa là 'đi đúng đường') · Xanh lam = ứng viên tạm được · Hồng = chữ bay bổng, có thể sai
Temperature: chắc chắn hay sáng tạo?
Cũng tình huống trên, nhưng giờ bạn cầm một nút vặn. Ở temperature thấp, máy luôn chọn chữ an toàn — viết chắc chắn, khô khan. Ở temperature cao, máy dám chọn chữ lạ — viết bay bổng, nhưng dễ trượt chân.
LLM nhớ được bao nhiêu chữ một lúc?
Mỗi model có một cửa sổ ngữ cảnh — giống trí nhớ ngắn hạn, đo bằng token (mảnh chữ). Kéo thanh dưới để xem mức đó tương đương công việc nào.
≈ báo cáo 20 trang
Tóm tắt báo cáo quý, lấy ra 5 điểm chính, soạn slide dẫn dắt.
LLM sinh câu trả lời theo từng từ một
Ở chế độ streaming, LLM vừa nghĩ vừa “gõ” — mỗi chữ bạn thấy là một lần máy đoán xác suất và chọn từ. Xem nhịp gõ mô phỏng dưới đây.
Sếp giao: 'Dùng ChatGPT soạn email gửi khách VIP xin gia hạn hợp đồng, đồng thời trích Điều 5.2 hợp đồng cũ'. Cách làm nào hợp lý nhất?
Giải thích
LLM (Large Language Model — mô hình ngôn ngữ lớn) là một cỗ máy đoán chữ tiếp theo, được luyện trên gần như toàn bộ chữ viết mà con người từng công khai. Ba chữ “lớn” có nghĩa thật sự:
Khi bạn gõ một câu, năm bước dưới đây diễn ra chớp nhoáng trong vòng chưa đầy một giây:
Kéo thả năm bước sau cho đúng thứ tự LLM xử lý câu hỏi của bạn:
Năm thuật ngữ sau sẽ đi cùng bạn suốt hành trình dùng AI. Ghép cặp để chắc chắn đã nắm:
Nối mỗi thuật ngữ ở Cột A với mô tả đúng ở Cột B.
Cột A
Cột B
Vậy LLM hợp với công việc nào? Bảng dưới xếp các việc văn phòng thường gặp. Bấm bộ lọc để xem chi tiết:
Soạn email trả khách hàng khó tính, giữ giọng lịch sự
LLM bắt chước văn phong dễ, bạn chỉ cần nêu rõ đối tượng và mức độ trang trọng.
Chấm 40 bài văn, đưa nhận xét cụ thể cho từng em
Dán bài, yêu cầu nhận xét theo 3 tiêu chí — LLM không biết mệt.
Rà lại hợp đồng 80 trang, gạch chân mọi điều khoản có từ 'độc quyền'
Dùng kèm RAG để trích dẫn đúng điều khoản, không bịa án lệ.
Tóm tắt 10 bài báo tiếng Anh về giá dầu, viết lead 60 từ
Luôn yêu cầu trích nguồn gốc để tránh bịa số liệu.
Đặt tên chiến dịch, viết 10 caption TikTok cho nhãn trà sữa
Tăng temperature để có ý tưởng bay bổng, giảm khi cần bám brief.
Ghi biên bản cuộc họp 90 phút từ bản ghi âm đã chuyển chữ
Yêu cầu model bám vào transcript, không tự thêm thông tin.
Tính thuế thu nhập cá nhân chính xác đến từng nghìn đồng
LLM là máy đoán chữ, không phải máy tính — luôn đối chiếu lại bằng Excel.
Tư vấn liều thuốc cho bệnh nhân cụ thể
Rủi ro quá cao: LLM có thể bịa liều, tên thuốc hoặc tương tác.
Để thấy khác biệt cụ thể, xem một buổi sáng thứ Hai của bạn trước và sau khi biết dùng LLM:
Cùng một nhiệm vụ: 'soạn email phản hồi 8 khách hàng về chính sách đổi trả mới'.
- Ảo giác (hallucination): LLM tự tin bịa ra điều luật, trích dẫn, tên sách — đặc biệt khi bạn hỏi chi tiết nhỏ.
- Cắt dữ liệu (training cutoff):model không biết tin sau thời điểm huấn luyện. Hỏi “tin tuần trước” rất rủi ro.
- Prompt injection: nếu bạn dán một email người lạ vào để AI tóm tắt, email đó có thể chứa chỉ dẫn ẩn lừa AI làm việc có hại.
Hiểu được cỗ máy này sẽ thay đổi cách bạn làm việc. Bài tiếp theo trong lộ trình sẽ dạy bạn viết prompt sao cho LLM đoán đúng hơn — khác biệt giữa người dùng AI khá và người dùng AI giỏi nằm ở kỹ năng đó.
- LLM là cỗ máy đoán chữ tiếp theo, luyện trên gần như toàn bộ chữ viết công khai của loài người.
- Temperature là nút vặn 'độ bay bổng' — thấp cho hợp đồng, cao cho ý tưởng sáng tạo.
- Cửa sổ ngữ cảnh là trí nhớ ngắn hạn của LLM; model hiện nay đủ nuốt cả hợp đồng 200 trang.
- LLM viết câu trôi chảy nhưng có thể bịa số liệu, điều luật, trích dẫn — luôn kiểm chứng ở việc quan trọng.
- Giao cho LLM: soạn email, tóm tắt báo cáo, viết caption. Đừng giao một mình: tính thuế, tư vấn thuốc, khẳng định điều luật.
Kiểm tra hiểu biết
Bạn nhập 'Viết email cảm ơn đối tác sau buổi họp hôm qua'. Về bản chất, LLM sẽ làm gì?