PhoGPT-7B Reasoning — model suy luận tiếng Việt đầu tiên

VinAI tune Llama-3.1 trên 40B token tiếng Việt có giải thích. VMLU 68%, ngang GPT-4o ở môn Văn và Sử. Model đầu tiên làm reasoning tốt trên tiếng Việt.

◆ VinAI Research·14 · 04 · 2026·6 phút·vinai.io ↗

01 · Cái mới

VinAI Research vừa ra PhoGPT-7B Reasoning — model đầu tiên được train để suy luận bằng tiếng Việt, không phải dịch tiếng Anh ra. Nền tảng là Llama-3.1-8B, fine-tune trên 40B token tiếng Việt có giải thích (đề + lời giải, theo chương trình phổ thông + đại học).

Điểm VMLU đạt 68% — ngang GPT-4o trên một số môn, vượt ở Văn và Sử. Quan trọng hơn con số: đây là model đầu tiên không “nói tiếng Việt giọng Tây”, tức không ép cú pháp tiếng Anh lên câu tiếng Việt khi trả lời dài.

02 · Benchmark

VMLU theo môn — nơi tiếng Việt khó hơn

Môn	PhoGPT-7B	Claude 4.6	GPT-4o
Văn học Việt Nam	82	71	74
Lịch sử Việt Nam	79	68	70
Địa lý Việt Nam	76	72	72
Toán chuyên	54	82	78
Vật lý	58	80	76
Hoá học	61	78	75

VMLU chia theo môn · xanh = PhoGPT dẫn · đen = Claude/GPT-4o dẫn

Thế mạnh: Văn, Sử, Địa lý Việt Nam — các môn cần hiểu ngữ cảnh văn hoá và thành ngữ. Điểm yếu: Toán chuyên, Vật lý — nơi Claude và GPT-4o vẫn vượt nhờ khối reasoning dài.

Điều ít ai chú ý: với tokenization tiếng Việt tốt hơn (BPE học trên corpus tiếng Việt), PhoGPT tốn ít token hơn 40% cho cùng một câu so với GPT-4o. Tức chạy local trên 1× A100 không còn là điều xa xỉ.

03 · Cách dùng

Chạy local, tune tiếp, hay gọi API — chọn theo use case

Dùng GPT-4o cho tiếng Việt

~3× token

1 câu tiếng Việt vào GPT thường tốn 1.5–3× token so với tiếng Anh cùng nghĩa. Hoá đơn tăng theo.

Dùng PhoGPT-7B

gần 1× token

Tokenizer học trên tiếng Việt. Cùng câu chỉ tốn một phần ba token. Chạy local trên 1× A100 với INT8.

VinAI publish trọng số Apache 2.0, kèm tokenizer và một bộ eval mở. Dev có thể fine-tune tiếp cho lĩnh vực riêng (luật, y, giáo dục) với ~400 ví dụ có giải thích.

Cảnh báo một lần: reasoning chain của PhoGPT ngắn hơn o-series. Các task cần chain-of-thought dài (giải hệ, chứng minh) PhoGPT thua. Nhưng task thực tế của đa số doanh nghiệp — trả lời chính sách, tóm tắt hợp đồng, giải thích quy trình — PhoGPT đủ và rẻ.

04 · Ai nên dùng

Doanh nghiệp Việt cần hiểu tiếng Việt

Trường học đang xây trợ giảng AI tiếng Việt, ngân hàng cần phân loại khiếu nại, y tế cần tóm tắt bệnh án, báo chí cần kiểm tra thông tin — những use case này đều có ngưỡng chấp nhận được với 7B. Không cần gọi GPT-4o nữa, không còn khoá data tại Mỹ.

Với cộng đồng Việt, đây là lần đầu có một mô hình đáng gọi là “của mình” mà vẫn chạy được trên RTX 4090. VinAI cho tải về huggingface.co/vinai/phogpt-7b-reasoning.

◆ Học sâu hơn

Nền tảng mà bài viết này dựa trên

→ Học bàiTokenization: chia văn bản thành tokennlp · advanced → Học bàiMô hình suy luận. AI biết nghĩ sâuemerging · advanced → Học bàiChain-of-thought: cho AI nháp trước khi chốtllm-concepts · beginner → Học bàiFine-tuning hay Prompting?llm-concepts · advanced

udemi / bài viết / phogpt-7b-reasoning

Việt NamViệt Nam