PhoGPT-7B Reasoning — model suy luận tiếng Việt đầu tiên
VinAI tune Llama-3.1 trên 40B token tiếng Việt có giải thích. VMLU 68%, ngang GPT-4o ở môn Văn và Sử. Model đầu tiên làm reasoning tốt trên tiếng Việt.
VinAI Research vừa ra PhoGPT-7B Reasoning — model đầu tiên được train để suy luận bằng tiếng Việt, không phải dịch tiếng Anh ra. Nền tảng là Llama-3.1-8B, fine-tune trên 40B token tiếng Việt có giải thích (đề + lời giải, theo chương trình phổ thông + đại học).
Điểm VMLU đạt 68% — ngang GPT-4o trên một số môn, vượt ở Văn và Sử. Quan trọng hơn con số: đây là model đầu tiên không “nói tiếng Việt giọng Tây”, tức không ép cú pháp tiếng Anh lên câu tiếng Việt khi trả lời dài.
VMLU theo môn — nơi tiếng Việt khó hơn
| Môn | PhoGPT-7B | Claude 4.6 | GPT-4o |
|---|---|---|---|
| Văn học Việt Nam | 82 | 71 | 74 |
| Lịch sử Việt Nam | 79 | 68 | 70 |
| Địa lý Việt Nam | 76 | 72 | 72 |
| Toán chuyên | 54 | 82 | 78 |
| Vật lý | 58 | 80 | 76 |
| Hoá học | 61 | 78 | 75 |
Thế mạnh: Văn, Sử, Địa lý Việt Nam — các môn cần hiểu ngữ cảnh văn hoá và thành ngữ. Điểm yếu: Toán chuyên, Vật lý — nơi Claude và GPT-4o vẫn vượt nhờ khối reasoning dài.
Điều ít ai chú ý: với tokenization tiếng Việt tốt hơn (BPE học trên corpus tiếng Việt), PhoGPT tốn ít token hơn 40% cho cùng một câu so với GPT-4o. Tức chạy local trên 1× A100 không còn là điều xa xỉ.
Chạy local, tune tiếp, hay gọi API — chọn theo use case
1 câu tiếng Việt vào GPT thường tốn 1.5–3× token so với tiếng Anh cùng nghĩa. Hoá đơn tăng theo.
Tokenizer học trên tiếng Việt. Cùng câu chỉ tốn một phần ba token. Chạy local trên 1× A100 với INT8.
VinAI publish trọng số Apache 2.0, kèm tokenizer và một bộ eval mở. Dev có thể fine-tune tiếp cho lĩnh vực riêng (luật, y, giáo dục) với ~400 ví dụ có giải thích.
Cảnh báo một lần: reasoning chain của PhoGPT ngắn hơn o-series. Các task cần chain-of-thought dài (giải hệ, chứng minh) PhoGPT thua. Nhưng task thực tế của đa số doanh nghiệp — trả lời chính sách, tóm tắt hợp đồng, giải thích quy trình — PhoGPT đủ và rẻ.
Doanh nghiệp Việt cần hiểu tiếng Việt
Trường học đang xây trợ giảng AI tiếng Việt, ngân hàng cần phân loại khiếu nại, y tế cần tóm tắt bệnh án, báo chí cần kiểm tra thông tin — những use case này đều có ngưỡng chấp nhận được với 7B. Không cần gọi GPT-4o nữa, không còn khoá data tại Mỹ.
Với cộng đồng Việt, đây là lần đầu có một mô hình đáng gọi là “của mình” mà vẫn chạy được trên RTX 4090. VinAI cho tải về huggingface.co/vinai/phogpt-7b-reasoning.