LLM Overview in Chat Assistants
LLM trong trợ lý trò chuyện
Công ty nào đang ứng dụng LLM?
Ngày 30 tháng 11 năm 2022, OpenAI mở cửa ChatGPT — một trợ lý trò chuyện chạy trên LLM (mô hình ngôn ngữ lớn). Chỉ năm ngày sau, ChatGPT có 1 triệu người dùng. Hai tháng sau, 100 triệu. Đó là tốc độ tăng trưởng chưa từng xuất hiện ở bất cứ ứng dụng tiêu dùng nào, kể cả Instagram hay TikTok.
Sau ChatGPT, Anthropic ra mắt Claude, Google ra mắt Gemini. Ba trợ lý này — mỗi cái dựng trên một LLM riêng — đã trở thành công cụ công việc hàng ngày của hàng trăm triệu người, từ nhân viên văn phòng ở Hà Nội đến luật sư ở New York.
Đường cong đỏ phía dưới là số lượng người dùng hoạt động hàng tuần của ChatGPT — tăng theo đường cong dốc đứng chưa từng thấy ở bất kỳ sản phẩm tiêu dùng nào.
ChatGPT ra mắt
người dùng sau 5 ngày
100 triệu người dùng
trong 2 tháng — nhanh nhất lịch sử
Bình thường mới
người dùng hoạt động hàng tuần
Vấn đề công ty cần giải quyết
Trước năm 2022, LLM đã tồn tại trong phòng thí nghiệm nhiều năm — nhưng chỉ các kỹ sư biết cách gọi API, viết code Python, xử lý chuỗi token. Người làm văn phòng không có cửa tiếp cận, dù đây là công cụ có thể tiết kiệm hàng giờ mỗi ngày.
Công việc văn phòng thường ngày — soạn email, tóm tắt báo cáo, dịch tài liệu, viết caption — phần lớn là xoay chữ: đọc, rút ý, viết lại. Chính là nơi LLM mạnh nhất. Nhưng không có giao diện nào đủ đơn giản cho người không biết lập trình.
Bài toán: làm sao biến một cỗ máy toán học khổng lồ thành một khung chat giống Messenger — nơi bạn gõ câu hỏi tiếng Việt và nhận câu trả lời tiếng Việt, không cần biết gì về AI?
Cùng một nhiệm vụ rất đời thường: soạn email xin sếp nghỉ 3 ngày vì con nhỏ ốm.
Cách LLM giải quyết vấn đề
- Bước 1/4
1/4 · ChatGPT mở màn
ChatGPT mở đầu kỷ nguyên trò chuyện với AI. OpenAI lấy GPT-3.5 (sau này là GPT-4), thêm một bước tinh chỉnh gọi là RLHF (Reinforcement Learning from Human Feedback — học tăng cường từ phản hồi của con người). Hàng ngàn người chấm điểm câu trả lời; model dần biết trả lời nào được ưa, trả lời nào bị chê. Kết quả: giọng chat tự nhiên, ít từ chối hơn, ít nói vô nghĩa hơn.
Người dùngpromptGPT-4RLHF tinh chỉnhNgười chấmRLHF (Reinforcement Learning from Human Feedback — học tăng cường từ phản hồi của con người): hàng ngàn người chấm điểm câu trả lời, model học ưu tiên câu nào được đánh giá cao.
- Bước 2/4
2/4 · Claude chú trọng an toàn
Claude đặt an toàn và ngữ cảnh dài lên hàng đầu. Anthropic áp dụng Constitutional AI (AI Hiến pháp) — dạy model tuân theo một bộ nguyên tắc đạo đức thay vì chỉ học từng trường hợp. Claude 2 ra mắt với cửa sổ ngữ cảnh 100.000 token, cao gấp 25 lần ChatGPT thời đó — đọc nổi một cuốn sách 300 trang trong một lượt chat.
Constitutional AI (AI Hiến pháp)1.Trung thực, không lừa gạt2.An toàn, tránh gây hại3.Tôn trọng quyền tự chủCửa sổ ngữ cảnh Claude 2: 100.000 token — đọc nổi một cuốn sách 300 trang trong một lượt chat. - Bước 3/4
3/4 · Gemini ôm đa phương thức
Gemini ôm trọn đa phương thức. Google dựng Gemini để đọc đồng thời văn bản, hình ảnh, mã nguồn, thậm chí video — không phải ba model riêng mà là một. Gemini 1.5 Pro đẩy cửa sổ ngữ cảnh lên 1 triệu token, đủ chứa cả một tủ hồ sơ dự án 2.000 trang vào một cuộc trò chuyện.
Đa phương thức (multimodal) — nuốt nhiều loại dữ liệu cùng lúcVăn bảnHình ảnhMã nguồnVideo→GeminiGemini 1.5 Pro: cửa sổ ngữ cảnh 1 triệu token — tương đương cả một tủ hồ sơ dự án hoặc một cuốn sách dài 2.000 trang đọc trong một lần chat.
- Bước 4/4
4/4 · Cuộc đua không ngừng
Cạnh tranh đẩy nhau chạy không nghỉ. ChatGPT thêm plugin và tìm kiếm web. Claude mở rộng ngữ cảnh lên 1 triệu token, rồi đi trước với Agent viết code. Gemini cắm sâu vào Google Workspace — Docs, Gmail, Meet. Cuộc đua diễn ra mỗi quý, người dùng là bên được lợi nhiều nhất: tính năng mới, giá giảm, tốc độ tăng.
Cuộc đua cửa sổ ngữ cảnh (tính bằng K token)2022ChatGPT4KClaude—Gemini—2023ChatGPT8KClaude100KGemini32K2024ChatGPT128KClaude200KGemini1000K2025ChatGPT256KClaude1000KGemini2000K
Con số thật
người dùng hoạt động hàng tuần của ChatGPT tính tới tháng 10/2025
tốc độ cán mốc 1 triệu người dùng — nhanh gấp 15 lần Instagram, 60 lần Facebook
người dùng hoạt động hàng tuần chỉ sau 2 năm ra mắt (tháng 8/2024)
Để dễ hình dung: 800 triệu người dùng nhiều hơn dân số toàn Liên Minh Châu Âu cộng với dân số Nhật Bản. Và đó mới chỉ là ChatGPT — chưa tính Claude và Gemini.
Nếu không có LLM, app sẽ ra sao?
Nếu không có LLM, cái gọi là “trợ lý AI” sẽ dừng ở mức chatbot theo kịch bản (rule-based) — chỉ trả lời được những câu đã được lập trình trước. Không viết được email lịch sự mới, không tóm tắt được báo cáo chưa từng đọc, không suy luận được về vấn đề mới.
Bốn việc văn phòng quen thuộc. Kéo qua lại để thấy khác biệt rõ nhất.
Soạn 10 email phản hồi khách hàng trong 1 buổi sáng
≈ 2h30' nếu viết tay từng email một
Tóm tắt báo cáo 40 trang để làm slide họp chiều nay
Phải đọc kỹ 2 tiếng, vẫn sót ý chính
Làm rõ một điều luật lao động bằng tiếng Việt dễ hiểu
Vào thuvienphapluat.vn, lọc, tra chéo, đọc bình luận
Viết caption tiếng Anh cho bài đăng LinkedIn
Tra Google Translate, câu cú cứng như robot
Sự bùng nổ của ChatGPT, Claude, Gemini cho thấy một điều cụ thể: LLM đã biến trợ lý AI từ một tiện ích hẹp thành một nền tảng phổ dụng. Tất cả nhờ một cơ chế cốt lõi — đoán chữ tiếp theo — được phóng to lên đến mức biết viết, biết dịch, biết tóm tắt ở chất lượng gần người. Biết thêm chút về nền tảng đó (ở bài lý thuyết LLM) sẽ giúp bạn dùng ba trợ lý này sắc bén hơn đồng nghiệp mình rất nhiều.