llm-concepts

LLM Overview in Chat Assistants

LLM trong ChatGPT, Claude, Gemini

Độ khóbeginner

Công ty nào đang ứng dụng LLM?

Ngày 30 tháng 11 năm 2022, OpenAI mở cửa ChatGPT, một trợ lý trò chuyện chạy trên LLM (mô hình ngôn ngữ lớn). Chỉ năm ngày sau, ChatGPT có 1 triệu người dùng. Hai tháng sau, 100 triệu. Đó là tốc độ tăng trưởng chưa từng xuất hiện ở bất cứ ứng dụng tiêu dùng nào, kể cả Instagram hay TikTok.

Sau ChatGPT, Anthropic ra mắt Claude, Google ra mắt Gemini. Ba trợ lý này, mỗi cái dựng trên một LLM riêng, đã trở thành công cụ công việc hàng ngày của hàng trăm triệu người, từ nhân viên văn phòng ở Hà Nội đến luật sư ở New York.

Từ 0 đến 800 triệu người dùng trong 35 tháng

Đường cong đỏ phía dưới là số lượng người dùng hoạt động hàng tuần của ChatGPT, tăng theo đường cong dốc đứng chưa từng thấy ở bất kỳ sản phẩm tiêu dùng nào.

30/11/2022

ChatGPT ra mắt

người dùng sau 5 ngày

Tháng 1/2023

100 triệu người dùng

trong 2 tháng, nhanh nhất lịch sử

Tháng 10/2025

Bình thường mới

người dùng hoạt động hàng tuần

Vì sao bài ứng dụng này đáng đọc?

Nếu bạn làm văn phòng ở Việt Nam năm 2026, có xác suất rất cao đồng nghiệp hoặc sếp của bạn đã dùng một trong ba trợ lý này. Hiểu ba sản phẩm đó khác nhau thế nào sẽ giúp bạn chọn đúng công cụ cho đúng việc, và không bị tụt lại.

Vấn đề công ty cần giải quyết

Trước năm 2022, LLM đã tồn tại trong phòng thí nghiệm nhiều năm, nhưng chỉ các kỹ sư biết cách gọi API, viết code Python, xử lý chuỗi token. Người làm văn phòng không có cửa tiếp cận, dù đây là công cụ có thể tiết kiệm hàng giờ mỗi ngày.

Công việc văn phòng thường ngày, soạn email, tóm tắt báo cáo, dịch tài liệu, viết caption, phần lớn là xoay chữ: đọc, rút ý, viết lại. Chính là nơi LLM mạnh nhất. Nhưng không có giao diện nào đủ đơn giản cho người không biết lập trình.

Bài toán: làm sao biến một cỗ máy toán học khổng lồ thành một khung chat giống Messenger, nơi bạn gõ câu hỏi tiếng Việt và nhận câu trả lời tiếng Việt, không cần biết gì về AI?

Cùng một nhiệm vụ rất đời thường: soạn email xin sếp nghỉ 3 ngày vì con nhỏ ốm.

Mở Google, gõ 'mẫu email xin nghỉ phép'

Lướt qua 7–8 trang blog, cóp ghép vài câu

Sửa tên, ngày, chức danh cho phù hợp với sếp

Đọc lại lần ba, vẫn thấy giọng văn cứng đơ

Tổng thời gian: ~25 phút cho một email dưới 100 chữ

Cách LLM giải quyết vấn đề

Bước 1/4
1/4 · ChatGPT mở màn
ChatGPT mở đầu kỷ nguyên trò chuyện với AI. OpenAI lấy GPT-3.5 (sau này là GPT-4), thêm một bước tinh chỉnh gọi là RLHF (Reinforcement Learning from Human Feedback): cách huấn luyện model bằng phản hồi của người đánh giá. Hàng ngàn người chấm điểm câu trả lời; model dần biết trả lời nào được ưa, trả lời nào bị chê. Kết quả: giọng chat tự nhiên, ít từ chối hơn, ít nói vô nghĩa hơn.
Người dùng
prompt
GPT-4
RLHF tinh chỉnh
Người chấm
RLHF (Reinforcement Learning from Human Feedback): cách huấn luyện model bằng phản hồi của người đánh giá. Hàng ngàn người chấm điểm câu trả lời, model học ưu tiên câu nào được đánh giá cao.
Bước 2/4
2/4 · Claude chú trọng an toàn
Claude đặt an toàn và ngữ cảnh dài lên hàng đầu. Anthropic áp dụng Constitutional AI (dạy model theo một bộ nguyên tắc) thay vì chỉ học từng trường hợp. Claude 2 ra mắt với cửa sổ ngữ cảnh 100.000 token, cao gấp 25 lần ChatGPT thời đó, đọc nổi một cuốn sách 300 trang trong một lượt chat.
Constitutional AI (dạy model theo một bộ nguyên tắc)
1.Trung thực, không lừa gạt
2.An toàn, tránh gây hại
3.Tôn trọng quyền tự chủ
Context window Claude 2: 100.000 token, đọc nổi một cuốn sách 300 trang trong một lượt chat.
Bước 3/4
3/4 · Gemini ôm đa phương thức
Gemini ôm trọn đa phương thức. Google dựng Gemini để đọc đồng thời văn bản, hình ảnh, mã nguồn, thậm chí video, không phải ba model riêng mà là một. Gemini 1.5 Pro đẩy cửa sổ ngữ cảnh lên 1 triệu token, đủ chứa cả một tủ hồ sơ dự án 2.000 trang vào một cuộc trò chuyện.
Đa phương thức (multimodal), nuốt nhiều loại dữ liệu cùng lúc
Văn bản
Hình ảnh
Mã nguồn
Video
→
Gemini
Gemini 1.5 Pro: cửa sổ ngữ cảnh 1 triệu token, tương đương cả một tủ hồ sơ dự án hoặc một cuốn sách dài 2.000 trang đọc trong một lần chat.
Bước 4/4
4/4 · Cuộc đua không ngừng
Cạnh tranh đẩy nhau chạy không nghỉ. ChatGPT thêm plugin và tìm kiếm web. Claude mở rộng ngữ cảnh lên 1 triệu token, rồi đi trước với Agent viết code. Gemini cắm sâu vào Google Workspace, Docs, Gmail, Meet. Cuộc đua diễn ra mỗi quý, người dùng là bên được lợi nhiều nhất: tính năng mới, giá giảm, tốc độ tăng.
Cuộc đua cửa sổ ngữ cảnh (tính bằng K token)
2022
ChatGPT
4K
Claude
,
Gemini
,
2023
ChatGPT
8K
Claude
100K
Gemini
32K
2024
ChatGPT
128K
Claude
200K
Gemini
1000K
2025
ChatGPT
256K
Claude
1000K
Gemini
2000K

Con số thật

800 triệu người dùng hoạt động hàng tuần cho ChatGPT (tháng 10/2025) [1]
1 triệu người dùng trong 5 ngày đầu tiên, nhanh gấp 15 lần Instagram [2]
200 triệu người dùng hoạt động hàng tuần chỉ sau 2 năm ra mắt [2]

Con số 1

0 triệu

người dùng hoạt động hàng tuần của ChatGPT tính tới tháng 10/2025

Con số 2

0 triệu trong 5 ngày

tốc độ cán mốc 1 triệu người dùng, nhanh gấp 15 lần Instagram, 60 lần Facebook

Con số 3

0 triệu

người dùng hoạt động hàng tuần chỉ sau 2 năm ra mắt (tháng 8/2024)

Để dễ hình dung: 800 triệu người dùng nhiều hơn dân số toàn Liên Minh Châu Âu cộng với dân số Nhật Bản. Và đó mới chỉ là ChatGPT, chưa tính Claude và Gemini.

Nếu không có LLM, app sẽ ra sao?

Nếu không có LLM, cái gọi là “trợ lý AI” sẽ dừng ở mức chatbot theo kịch bản (rule-based), chỉ trả lời được những câu đã được lập trình trước. Không viết được email lịch sự mới, không tóm tắt được báo cáo chưa từng đọc, không suy luận được về vấn đề mới.

Bốn việc văn phòng quen thuộc. Kéo qua lại để thấy khác biệt rõ nhất.

Soạn 10 email phản hồi khách hàng trong 1 buổi sáng

≈ 2h30' nếu viết tay từng email một

Tóm tắt báo cáo 40 trang để làm slide họp chiều nay

Phải đọc kỹ 2 tiếng, vẫn sót ý chính

Làm rõ một điều luật lao động bằng tiếng Việt dễ hiểu

Vào thuvienphapluat.vn, lọc, tra chéo, đọc bình luận

Viết caption tiếng Anh cho bài đăng LinkedIn

Tra Google Translate, câu cú cứng như robot

Sự bùng nổ của ChatGPT, Claude, Gemini cho thấy một điều cụ thể: LLM đã biến trợ lý AI từ một tiện ích hẹp thành một nền tảng phổ dụng. Tất cả nhờ một cơ chế cốt lõi, đoán chữ tiếp theo, được phóng to lên đến mức biết viết, biết dịch, biết tóm tắt ở chất lượng gần người. Biết thêm chút về nền tảng đó (ở bài lý thuyết LLM) sẽ giúp bạn dùng ba trợ lý này sắc bén hơn đồng nghiệp mình rất nhiều.

Chủ đề liên quan

Large Language Models: LLM: máy đoán chữ đứng sau chatbot

Công ty nào đang ứng dụng LLM?

Từ 0 đến 800 triệu người dùng trong 35 tháng

30/11/2022

ChatGPT ra mắt

người dùng sau 5 ngày

Tháng 1/2023

100 triệu người dùng

trong 2 tháng, nhanh nhất lịch sử

Tháng 10/2025

Bình thường mới

người dùng hoạt động hàng tuần

Vì sao bài ứng dụng này đáng đọc?

Vấn đề công ty cần giải quyết

Cùng một nhiệm vụ rất đời thường: soạn email xin sếp nghỉ 3 ngày vì con nhỏ ốm.

Mở Google, gõ 'mẫu email xin nghỉ phép'

Lướt qua 7–8 trang blog, cóp ghép vài câu

Sửa tên, ngày, chức danh cho phù hợp với sếp

Đọc lại lần ba, vẫn thấy giọng văn cứng đơ

Tổng thời gian: ~25 phút cho một email dưới 100 chữ

Cách LLM giải quyết vấn đề

Bước 1/4

1/4 · ChatGPT mở màn

ChatGPT mở đầu kỷ nguyên trò chuyện với AI. OpenAI lấy GPT-3.5 (sau này là GPT-4), thêm một bước tinh chỉnh gọi là RLHF (Reinforcement Learning from Human Feedback): cách huấn luyện model bằng phản hồi của người đánh giá. Hàng ngàn người chấm điểm câu trả lời; model dần biết trả lời nào được ưa, trả lời nào bị chê. Kết quả: giọng chat tự nhiên, ít từ chối hơn, ít nói vô nghĩa hơn.

Người dùng

prompt

GPT-4

RLHF tinh chỉnh

Người chấm

RLHF (Reinforcement Learning from Human Feedback): cách huấn luyện model bằng phản hồi của người đánh giá. Hàng ngàn người chấm điểm câu trả lời, model học ưu tiên câu nào được đánh giá cao.

Bước 2/4

2/4 · Claude chú trọng an toàn

Claude đặt an toàn và ngữ cảnh dài lên hàng đầu. Anthropic áp dụng Constitutional AI (dạy model theo một bộ nguyên tắc) thay vì chỉ học từng trường hợp. Claude 2 ra mắt với cửa sổ ngữ cảnh 100.000 token, cao gấp 25 lần ChatGPT thời đó, đọc nổi một cuốn sách 300 trang trong một lượt chat.

Constitutional AI (dạy model theo một bộ nguyên tắc)

1.Trung thực, không lừa gạt

2.An toàn, tránh gây hại

3.Tôn trọng quyền tự chủ

Context window Claude 2: 100.000 token, đọc nổi một cuốn sách 300 trang trong một lượt chat.

Bước 3/4

3/4 · Gemini ôm đa phương thức

Gemini ôm trọn đa phương thức. Google dựng Gemini để đọc đồng thời văn bản, hình ảnh, mã nguồn, thậm chí video, không phải ba model riêng mà là một. Gemini 1.5 Pro đẩy cửa sổ ngữ cảnh lên 1 triệu token, đủ chứa cả một tủ hồ sơ dự án 2.000 trang vào một cuộc trò chuyện.

Đa phương thức (multimodal), nuốt nhiều loại dữ liệu cùng lúc

Văn bản

Hình ảnh

Mã nguồn

Video

→

Gemini

Gemini 1.5 Pro: cửa sổ ngữ cảnh 1 triệu token, tương đương cả một tủ hồ sơ dự án hoặc một cuốn sách dài 2.000 trang đọc trong một lần chat.

Bước 4/4

4/4 · Cuộc đua không ngừng

Cạnh tranh đẩy nhau chạy không nghỉ. ChatGPT thêm plugin và tìm kiếm web. Claude mở rộng ngữ cảnh lên 1 triệu token, rồi đi trước với Agent viết code. Gemini cắm sâu vào Google Workspace, Docs, Gmail, Meet. Cuộc đua diễn ra mỗi quý, người dùng là bên được lợi nhiều nhất: tính năng mới, giá giảm, tốc độ tăng.

Cuộc đua cửa sổ ngữ cảnh (tính bằng K token)

2022

ChatGPT

Claude

Gemini

2023

ChatGPT

Claude

100K

Gemini

32K

2024

ChatGPT

128K

Claude

200K

Gemini

1000K

2025

ChatGPT

256K

Claude

1000K

Gemini

2000K

Nếu không có LLM, app sẽ ra sao?

Bốn việc văn phòng quen thuộc. Kéo qua lại để thấy khác biệt rõ nhất.

Soạn 10 email phản hồi khách hàng trong 1 buổi sáng

≈ 2h30' nếu viết tay từng email một

Tóm tắt báo cáo 40 trang để làm slide họp chiều nay

Phải đọc kỹ 2 tiếng, vẫn sót ý chính

Làm rõ một điều luật lao động bằng tiếng Việt dễ hiểu

Vào thuvienphapluat.vn, lọc, tra chéo, đọc bình luận

Viết caption tiếng Anh cho bài đăng LinkedIn

Tra Google Translate, câu cú cứng như robot

LLM Overview in Chat Assistants

Công ty nào đang ứng dụng LLM?

Vấn đề công ty cần giải quyết

Cách LLM giải quyết vấn đề

Con số thật

Nếu không có LLM, app sẽ ra sao?

Tài liệu tham khảo (4)

Chủ đề liên quan

LLM Overview in Chat Assistants

Công ty nào đang ứng dụng LLM?

Vấn đề công ty cần giải quyết

Cách LLM giải quyết vấn đề

Con số thật

Nếu không có LLM, app sẽ ra sao?

Tài liệu tham khảo (4)

Chủ đề liên quan