llm-concepts

Large Language Models

LLM: máy đoán chữ đứng sau chatbot

Độ khóbeginner

1Thử đoán1/8

Bạn gõ vào ChatGPT: 'Soạn giúp tôi email xin nghỉ phép 3 ngày'. Theo bạn, trong đầu máy đang diễn ra chuyện gì?

2Ẩn dụ2/8

Hình dung một bác bán phở Bát Đàn đứng ba mươi năm ở góc phố. Khách vừa bước vào, chưa kịp ngồi xuống bác đã biết hôm nay khách gọi tái gầu hay chín nạm, có dưa muối hay không. Bác không đọc được ý nghĩ ai cả, bác chỉ đã nhìn hàng chục vạn lượt khách, nên bộ não bác nắm được một quy luật mỏng manh nhưng đáng tin: người mặc sơ mi, đi xe tay ga, vào lúc 7 giờ sáng thường gọi cái gì.

LLM chính là bác bán phở đó, phóng to lên hàng triệu lần. Nó đã đọc gần như toàn bộ Internet, sách, báo, diễn đàn, email công khai... Khi bạn bắt đầu gõ một câu, nó nhìn các chữ đã có, dò lại ký ức khổng lồ ấy, rồi đoán chữ tiếp theo nào hợp vai nhất. Đó là toàn bộ phép thuật, không có gì hơn.

Điều hay là: vì đã đọc quá nhiều, nó biết văn phong email công sở khác văn tin nhắn bạn bè, biết câu trong biên bản họp không giống câu trong caption Tiktok. Điều đáng sợ là: khi không biết, nó vẫn đoán một cách tự tin, đôi khi bịa ra điều luật, tên sách, trích dẫn không tồn tại. Dùng LLM ở công việc nghĩa là học cách phát huy ưu thế và cảnh giác với điểm yếu đó.

3Nhìn tận mắt3/8

Hình minh họa

1Demo 1, Đoán chữ tiếp theo

Bạn là LLM: đoán chữ sắp gõ tiếp theo

Chọn một tình huống văn phòng. Máy đang đứng trước câu hỏi: “chữ nào hợp nhất để gõ tiếp?” Mỗi thanh là xác suất máy dành cho từng ứng viên.

Câu bạn đã gõ tới đây

Kính gửi anh Minh, em viết email này để xin phép nghỉ

phép

70.2%

một

20.4%

làm

4.9%

buổi

3.3%

việc

0.7%

ngơi

0.5%

Xanh lá = chữ an toàn (nghĩa là 'đi đúng đường') · Xanh lam = ứng viên tạm được · Hồng = chữ bay bổng, có thể sai

2Demo 2, Nút vặn 'độ bay bổng'

Temperature: chắc chắn hay sáng tạo?

Cũng tình huống trên, nhưng giờ bạn cầm một nút vặn. Ở temperature thấp, máy luôn chọn chữ an toàn, viết chắc chắn, khô khan. Ở temperature cao, máy dám chọn chữ lạ, viết bay bổng, nhưng dễ trượt chân.

Temperature0.40

0.00, cứng như đá0.60, vừa tay1.20, bay như thơ

Gợi ý thực tế

Khi soạn hợp đồng, báo cáo số liệu, để temperature thấp (dưới 0.3). Khi nghĩ tên chiến dịch, lời quảng cáo, kéo lên 0.8–1.1 cho ý tưởng đỡ giống nhau.

3Demo 3, Context window

LLM nhớ được bao nhiêu chữ một lúc?

Mỗi model có một cửa sổ ngữ cảnh, giống trí nhớ ngắn hạn, đo bằng token (mảnh chữ). Kéo thanh dưới để xem mức đó tương đương công việc nào.

32.000 token

≈ báo cáo 20 trang

càng trái = ít chữ · càng phải = nhiều chữ

4K32K128K200K1M

Ví dụ việc văn phòng vừa đủ báo cáo 20 trang

Tóm tắt báo cáo quý, lấy ra 5 điểm chính, soạn slide dẫn dắt.

Mẹo đo trong thực tế

Một trang Word (~300 từ tiếng Việt) rơi vào khoảng 600–900 token. Hợp đồng 50 trang ≈ 40K token, hầu hết model hiện nay nuốt trọn không vấn đề.

4Demo 4, LLM 'gõ' thế nào?

LLM sinh câu trả lời theo từng từ một

Ở chế độ streaming, LLM vừa nghĩ vừa “gõ”, mỗi chữ bạn thấy là một lần máy đoán xác suất và chọn từ. Xem nhịp gõ mô phỏng dưới đây.

Vì sao điều này quan trọng?

Streaming giúp bạn thấy câu trả lời sớm, nhưng cũng là lúc dễ mắc bẫy: nửa đầu nghe hợp lý, nửa sau bịa. Đừng dừng đọc ở dòng thứ hai, rà hết câu mới quyết định có dùng hay không.

4Khoảnh khắc Aha4/8

LLM không biết điều gì là đúng. Nó biết điều gì nghe hợp lý dựa trên hàng núi chữ đã đọc. Đó là vì sao email AI viết đọc trôi như người thật, nhưng con số và trích dẫn thì vẫn phải tự tay bạn kiểm lại. Biết rõ biên giới đó, bạn biến LLM thành trợ lý đắc lực; quên đi, bạn biến nó thành cái bẫy.

5Thử thách5/8

Sếp giao: 'Dùng ChatGPT soạn email gửi khách VIP xin gia hạn hợp đồng, đồng thời trích Điều 5.2 hợp đồng cũ'. Cách làm nào hợp lý nhất?

6Giải thích6/8

Giải thích

LLM (Large Language Model, mô hình ngôn ngữ lớn) là một cỗ máy đoán chữ tiếp theo, được luyện trên gần như toàn bộ chữ viết mà con người từng công khai. Ba chữ “lớn” có nghĩa thật sự:

Lớn về dữ liệu

~10.000 tỷ

từ đã đọc, tương đương gần hết sách, báo, Wikipedia, diễn đàn mở trên Internet.

Lớn về tham số

~1.700 tỷ

“nút vặn” bên trong model, mỗi nút tinh chỉnh cảm giác về một mẩu ngữ cảnh.

Lớn về chi phí

~$100 triệu

tiền điện và GPU để huấn luyện một thế hệ model đầu bảng, bằng một dự án xây cầu vừa.

Khi bạn gõ một câu, năm bước dưới đây diễn ra chớp nhoáng trong vòng chưa đầy một giây:

Kéo thả năm bước sau cho đúng thứ tự LLM xử lý câu hỏi của bạn:

Người học viết câu hỏi, ví dụ: 'Giúp tôi viết email xin nghỉ phép 3 ngày.'

Máy cắt câu thành token, các mảnh chữ nhỏ để model xử lý.

Model đọc hết token, tính xác suất cho MỌI từ có thể xuất hiện tiếp theo.

Chọn một từ theo xác suất, in ra màn hình, rồi lặp lại quá trình cho từ sau.

Lặp đi lặp lại cho tới khi tạo đủ câu trả lời hoặc gặp dấu kết thúc.

Đơn giản đến bất ngờ

Đằng sau ChatGPT, Claude, Gemini, về cốt lõi, chỉ là vòng lặp “đoán chữ tiếp theo”. Sở dĩ nó nghe thông minh là vì vòng lặp đó được chạy qua một bộ não khổng lồ đã đọc gần hết kho chữ loài người.

Năm thuật ngữ sau sẽ đi cùng bạn suốt hành trình dùng AI. Ghép cặp để chắc chắn đã nắm:

Nối mỗi thuật ngữ ở Cột A với mô tả đúng ở Cột B.

Cột A

Cột B

Vậy LLM hợp với công việc nào? Bảng dưới xếp các việc văn phòng thường gặp. Bấm bộ lọc để xem chi tiết:

Nhân viên văn phòngrất hợp

Soạn email trả khách hàng khó tính, giữ giọng lịch sự

LLM bắt chước văn phong dễ, bạn chỉ cần nêu rõ đối tượng và mức độ trang trọng.

Giáo viênrất hợp

Chấm 40 bài văn, đưa nhận xét cụ thể cho từng em

Dán bài, yêu cầu nhận xét theo 3 tiêu chí, LLM không biết mệt.

Luật sư / pháp chếrất hợp

Rà lại hợp đồng 80 trang, gạch chân mọi điều khoản có từ 'độc quyền'

Dùng kèm RAG để trích dẫn đúng điều khoản, không bịa án lệ.

Nhà báo / biên tậprất hợp

Tóm tắt 10 bài báo tiếng Anh về giá dầu, viết lead 60 từ

Luôn yêu cầu trích nguồn gốc để tránh bịa số liệu.

Marketerrất hợp

Đặt tên chiến dịch, viết 10 caption TikTok cho nhãn trà sữa

Tăng temperature để có ý tưởng bay bổng, giảm khi cần bám brief.

Trợ lý hành chínhrất hợp

Ghi biên bản cuộc họp 90 phút từ bản ghi âm đã chuyển chữ

Yêu cầu model bám vào transcript, không tự thêm thông tin.

Kế toánphải cẩn thận

Tính thuế thu nhập cá nhân chính xác đến từng nghìn đồng

LLM là máy đoán chữ, không phải máy tính, luôn đối chiếu lại bằng Excel.

Bác sĩ, dược sĩđừng giao một mình

Tư vấn liều thuốc cho bệnh nhân cụ thể

Rủi ro quá cao: LLM có thể bịa liều, tên thuốc hoặc tương tác.

Để thấy khác biệt cụ thể, xem một buổi sáng thứ Hai của bạn trước và sau khi biết dùng LLM:

Cùng một nhiệm vụ: 'soạn email phản hồi 8 khách hàng về chính sách đổi trả mới'.

2 giờ 15 phút để viết tay 8 email, mỗi email 3 đoạn.

Đầu giờ viết kỹ, cuối giờ mệt, câu chữ cụt dần, dễ thiếu lịch sự.

Không còn thời gian cho việc quan trọng khác: phân tích dữ liệu, chuẩn bị họp.

Ba cạm bẫy đừng quên

Ảo giác (hallucination): LLM tự tin bịa ra điều luật, trích dẫn, tên sách, đặc biệt khi bạn hỏi chi tiết nhỏ.
Cắt dữ liệu (training cutoff):model không biết tin sau thời điểm huấn luyện. Hỏi “tin tuần trước” rất rủi ro.
Prompt injection: nếu bạn dán một email người lạ vào để AI tóm tắt, email đó có thể chứa chỉ dẫn ẩn lừa AI làm việc có hại.

Hiểu được cỗ máy này sẽ thay đổi cách bạn làm việc. Bài tiếp theo trong lộ trình sẽ dạy bạn viết prompt sao cho LLM đoán đúng hơn, khác biệt giữa người dùng AI khá và người dùng AI giỏi nằm ở kỹ năng đó.

7Tóm tắt7/8

Năm điều mang theo ra khỏi bài

LLM là cỗ máy đoán chữ tiếp theo, luyện trên gần như toàn bộ chữ viết công khai của loài người.
Temperature là nút vặn 'độ bay bổng', thấp cho hợp đồng, cao cho ý tưởng sáng tạo.
Context window là trí nhớ ngắn hạn của LLM; model hiện nay đủ đọc cả hợp đồng 200 trang.
LLM viết câu trôi chảy nhưng có thể bịa số liệu, điều luật, trích dẫn, luôn kiểm chứng ở việc quan trọng.
Giao cho LLM: soạn email, tóm tắt báo cáo, viết caption. Đừng giao một mình: tính thuế, tư vấn thuốc, khẳng định điều luật.

8Kiểm tra8/8

Kiểm tra hiểu biết

Câu 1/6

Bạn nhập 'Viết email cảm ơn đối tác sau buổi họp hôm qua'. Về bản chất, LLM sẽ làm gì?

Chủ đề liên quan

GPT: GPT - Mô hình ngôn ngữ tự hồi quy Transformer: Kiến trúc Transformer Fine-tuning vs Prompting: Fine-tuning hay Prompting?