applied-ai

AI Tool Evaluation

Chọn AI tool bằng bảng tiêu chí

Độ khóintermediate

1Dự đoán1/8

Với cùng một tác vụ 'tóm tắt báo cáo 50 trang', bạn thử trên ChatGPT miễn phí và Claude miễn phí. Kết quả KHẢ NĂNG CAO sẽ khác nhau ở điểm nào?

2Hình dung2/8

Chọn AI giống như chọn nhân viên cho một công việc. Mỗi người có thế mạnh khác nhau: người giỏi viết, người giỏi tính toán, người nhanh tay, người cẩn thận. Không ai "tốt nhất" cho mọi việc.

Bạn phải biết tác vụ cần gì trước, rồi mới ghép người phù hợp. Cùng là AI, nhưng Claude "đọc dài hiểu sâu", Gemini "nhanh và rẻ", ChatGPT "đa năng nhưng không chuyên", Copilot "gắn chặt vào Word/Excel". Phải thử mới biết cái nào hợp công việc cụ thể của bạn.

3Thực hành3/8

Hình minh họa

Demo 1: Tự xây scorecard theo ưu tiên của bạn

Mỗi công ty có ưu tiên khác nhau. Công ty chi tiêu tiết kiệm coi trọng giá. Công ty pháp lý coi trọng chất lượng + bảo mật. Kéo slider và xem thứ hạng công cụ thay đổi theo ưu tiên của bạn.

Kéo slider để đánh trọng số cho 6 tiêu chí (0 = không quan trọng, 5 = cực kỳ quan trọng)

Xếp hạng công cụ theo trọng số bạn chọn

1GeminiGoogle87

2ClaudeAnthropic83

3ChatGPTOpenAI80

4Microsoft 365 CopilotMicrosoft80

5PerplexityPerplexity AI77

Tip: Bấm các slider bên dưới để thấy thứ tự thay đổi theo ưu tiên của bạn.

Chất lượng output3

Giá3

Tốc độ3

Bảo mật3

Tích hợp3

Hỗ trợ tiếng Việt3

Demo 2: Ghép tác vụ với công cụ phù hợp

Click vào tác vụ ở cột A, rồi click công cụ ở cột B bạn nghĩ phù hợp nhất.

Ghép 5 tác vụ phổ biến ở văn phòng VN với công cụ AI phù hợp nhất.

Cột A

Cột B

Demo 3: Cùng prompt, ba công cụ trả lời khác nhau thế nào

Bấm qua từng tab để xem cách mỗi công cụ xử lý cùng một yêu cầu phân tích báo cáo doanh thu.

Cùng một prompt

"Tóm tắt báo cáo doanh thu Q1 2026: Doanh thu 45 tỷ (+12% YoY), lợi nhuận 8 tỷ (+5%), chi phí vận hành tăng 18%. Khách hàng mới 1,200 (giảm 8%). Đề xuất 3 hành động."

ChatGPT (GPT-4)

Điểm chính Q1/2026: Doanh thu tăng tốt (+12%), nhưng tăng chi phí (+18%) vượt tăng doanh thu → biên lợi nhuận mỏng đi. Khách hàng mới giảm 8% đáng lo.

3 hành động: (1) Rà soát chi phí vận hành, cắt mục không thiết yếu; (2) Đầu tư lại vào marketing để khôi phục tăng trưởng khách mới; (3) Phân tích nhóm khách cũ, tăng cross-sell bù cho giảm khách mới.

≈ 340 ký tự, tốc độ ~2s

Bấm qua từng tab để so sánh

Cùng prompt, ba công cụ cho ba phong cách khác nhau. Claude chi tiết và giữ dấu VN ổn định. Gemini nhanh nhưng dễ mix tiếng Anh. ChatGPT cân bằng. Thử cả ba với workload thật của bạn.

4Aha4/8

Không có tool tốt nhất, chỉ có tool phù hợp nhất cho tác vụ cụ thể của bạn. Thay vì hỏi "ChatGPT hay Claude tốt hơn?" hãy hỏi: "với tác vụ X và ưu tiên Y của công ty, tool nào thắng trên 6 tiêu chí?" Câu trả lời có thể khác nhau giữa các phòng trong cùng công ty.

5Thử thách5/8

Bạn là quản lý Marketing. Công việc chính: soạn content + tìm xu hướng thị trường + tạo ảnh cho chiến dịch. Công ty có ngân sách vừa phải. Chiến lược đa-công-cụ nào hợp lý nhất?

6Giải thích6/8

Giải thích

Framework 6 tiêu chí đánh giá

Chất lượng output

Câu trả lời có đúng, đầy đủ, đúng ngữ cảnh tiếng Việt không.

Giá

Chi phí theo tháng hoặc theo lượng query, bao gồm cả gói doanh nghiệp.

Tốc độ

Thời gian chờ câu trả lời. Quan trọng với chatbot khách hàng.

Bảo mật

Có cam kết không dùng dữ liệu của bạn để huấn luyện, DPA, audit log không.

Tích hợp

Có nối được với Google Workspace, Microsoft 365, Slack, hay phần mềm công ty.

Hỗ trợ tiếng Việt

Có giữ dấu đúng không, hiểu ngữ cảnh văn hóa Việt, có mất dấu ở output dài không.

Cách dùng framework

Với mỗi tác vụ, cho điểm trọng số 0–5 cho mỗi tiêu chí (tổng không bắt buộc là 15). Rồi tính điểm tổng cho từng công cụ: điểm mỗi tiêu chí × trọng số, cộng lại. Công cụ điểm cao nhất là lựa chọn hợp lý, nhưng luôn thử thực tế với 5–10 prompt trước khi chốt mua hoặc triển khai.

5 công cụ AI phổ biến, mạnh và yếu

ChatGPT

OpenAI

Free · Plus $20 · Team $25/user · Enterprise tùy

Mạnh

+Hệ sinh thái lớn nhất, nhiều tích hợp sẵn
+App mobile + voice mode tốt
+Tạo ảnh DALL-E ngay trong chat

Yếu

−Đôi khi mất dấu tiếng Việt ở bài dài
−Tier miễn phí lưu hội thoại có thể dùng để huấn luyện

Phù hợp: Work chung, tạo hình ảnh, tổng hợp đa phương tiện

Claude

Anthropic

Free · Pro $20 · Team $25/user · Enterprise tùy

Mạnh

+Viết + phân tích văn bản dài tốt, giữ dấu VN ổn định
+No-train mặc định ở mọi tier API
+Coding + reasoning mạnh ở benchmark mới nhất

Yếu

−Không tạo ảnh trực tiếp
−Hệ sinh thái plugin nhỏ hơn OpenAI

Phù hợp: Phân tích báo cáo dài, soạn thảo văn bản, code, tài liệu pháp lý

Gemini

Google

Free · AI Premium $20 · Workspace $20–30/user

Mạnh

+Rẻ nhất ở tier mid (Flash), tốc độ cao
+Tích hợp sâu Google Workspace (Docs, Sheets, Gmail)
+Context window lớn (2M token), xử lý được video/audio

Yếu

−Đôi khi code-switch sang tiếng Anh không chủ đích
−Safety classifier đôi lúc từ chối query hợp lệ

Phù hợp: Chatbot volume lớn, Google Workspace user, phân tích video/hình

Microsoft 365 Copilot

Microsoft

$30/user/tháng (kèm M365 Business)

Mạnh

+Tích hợp chặt Word, Excel, Outlook, Teams
+Zero Data Retention option, dữ liệu nằm trong tenant M365
+Đã có region Singapore gần Việt Nam

Yếu

−Bắt buộc phải có M365 Business, giá cao
−Chất lượng văn bản tự do kém hơn Claude/ChatGPT

Phù hợp: Công ty đã dùng M365, cần AI trong Word/Excel/Outlook

Perplexity

Perplexity AI

Free · Pro $20 · Enterprise $40/user

Mạnh

+Trích dẫn nguồn rõ ràng, tốt cho research
+Cập nhật thông tin realtime từ web
+Tìm thông tin thị trường VN khá ổn

Yếu

−Enterprise tier còn non, ít DPA mạnh
−Không tốt cho viết sáng tạo dài

Phù hợp: Nghiên cứu thị trường, tìm số liệu, fact-check

Tổng chi phí sở hữu (TCO), tính đủ 5 thành phần

Tổng chi phí sở hữu (TCO) không chỉ là giá API

Khi chọn AI tool, tính đủ 5 thành phần dưới. Tỉ lệ dưới đây là phân bố điển hình cho một dự án AI nội bộ năm đầu tiên ở công ty vừa và nhỏ.

30%

15%

25%

10%

20%

Giá API / subscription

30%

Chi phí trực tiếp trả cho vendor theo tháng hoặc theo token

Hạ tầng đi kèm

15%

Vector DB, orchestration, monitoring, caching, thường bị quên

Công sức kỹ sư

25%

Viết prompt, integrate SDK, xây eval set, fine-tune, maintain

Độ trễ người dùng

10%

Latency cao = user bỏ đi. Mỗi +100ms giảm conversion ~1%

Chi phí migrate sau này

20%

Đổi vendor = viết lại prompt + re-eval + đào tạo lại team

6 dấu hiệu đỏ khi chọn AI cho công ty

Chưa có trên thị trường VN

Công cụ chưa có thanh toán bằng thẻ VN, chưa có hóa đơn VAT, chưa có gói doanh nghiệp ở region châu Á, sẽ khó triển khai cho team ở VN.

Không có gói trả phí rõ ràng

Chỉ có tier miễn phí, không có Team/Enterprise tier → không thể ký DPA, không có cam kết no-train, không có audit log. Không dùng cho dữ liệu công ty.

Bảo mật mập mờ

Website không nói rõ có dùng dữ liệu để huấn luyện không, không có trang trust center, không có chứng chỉ SOC 2 / ISO 27001. Tránh.

Chỉ có benchmark nội bộ

Nhà cung cấp chỉ công bố điểm benchmark nội bộ. Chưa có đánh giá độc lập từ LMSYS Arena hoặc HELM.

Không rõ ai đứng sau

Công ty không rõ, không có địa chỉ đăng ký, team nhỏ không xác minh được. Nguy cơ ngừng dịch vụ bất ngờ, dữ liệu mất.

Khóa vendor lock-in nặng

Fine-tune, dataset, prompt format đều độc quyền, sau này muốn đổi phải viết lại từ đầu. Chọn công cụ có portable format.

Cây quyết định: 5 tình huống văn phòng VN phổ biến

Bấm qua từng tab để xem gợi ý công cụ cho từng loại tác vụ.

Soạn email + tài liệu trong Word/Outlook

Ưu tiên: Tích hợp (5/5), bảo mật (5/5), tiếng Việt (4/5)

Chọn: Microsoft 365 Copilot, nếu công ty đã có M365. Nếu chưa, dùng Claude for Work + copy sang Word.

Lý do: Copilot hiểu cấu trúc Word/Outlook, dữ liệu nằm trong tenant công ty, có Zero Data Retention.

3 sai lầm phổ biến khi chọn AI

1. Chạy theo hype: Tool mới ra luôn được ca ngợi. Chờ 4–8 tuần, đợi benchmark độc lập và feedback cộng đồng trước khi dùng cho production.

2. Khóa một vendor: Viết prompt và workflow phụ thuộc quirks của một tool. Sau này khó đổi. Dùng abstraction layer (LiteLLM, LangChain) hoặc giữ prompt ở dạng portable.

3. Chỉ tính giá API: Tổng chi phí = giá API + thời gian kỹ sư + độ trễ người dùng + chi phí migrate sau này. Tool rẻ nhất về API có thể đắt nhất về tổng chi phí.

7Tóm tắt7/8

5 điều cần nhớ khi chọn AI tool

6 tiêu chí: chất lượng, giá, tốc độ, bảo mật, tích hợp, hỗ trợ tiếng Việt. Trọng số khác nhau cho từng tác vụ.
Không có tool tốt nhất, có tool phù hợp nhất. ChatGPT đa năng, Claude mạnh văn bản dài, Gemini rẻ + nhanh, Copilot gắn chặt M365, Perplexity research.
Multi-tool stack thường hiệu quả hơn một công cụ duy nhất. Ví dụ: Claude (viết) + Perplexity (research) + ChatGPT (ảnh).
Red flag: không có enterprise tier, không có DPA, chỉ có benchmark tự công bố, vendor mập mờ, tránh.
Trước khi chốt công cụ cho công ty, xây eval set 30–50 example từ workload thật, chạy head-to-head, chấm điểm theo rubric.

Chọn đúng tool nhưng dùng sai cách vẫn không hiệu quả, xem Prompt Engineering. Bảo mật và Nghị định 13/2023 là yếu tố chi phối lựa chọn ở VN, xem Bảo mật khi dùng AI.

8Kiểm tra8/8

Bước 8/8

Kiểm tra hiểu biết

Câu 1/6

Bạn cần chọn AI cho 50 nhân viên văn phòng chủ yếu dùng Word và Outlook cho tài liệu và email khách hàng. Chọn tool nào phù hợp nhất?

Chủ đề liên quan

Getting Started with AI: Bắt đầu với AI: hỏi đúng việc đầu tiên Prompt Engineering: Prompt engineering: biến yêu cầu thành spec AI for Writing: AI hỗ trợ viết email, báo cáo, slide

Hình minh họa

Demo 1: Tự xây scorecard theo ưu tiên của bạn

Kéo slider để đánh trọng số cho 6 tiêu chí (0 = không quan trọng, 5 = cực kỳ quan trọng)

Xếp hạng công cụ theo trọng số bạn chọn

1GeminiGoogle87

2ClaudeAnthropic83

3ChatGPTOpenAI80

4Microsoft 365 CopilotMicrosoft80

5PerplexityPerplexity AI77

Tip: Bấm các slider bên dưới để thấy thứ tự thay đổi theo ưu tiên của bạn.

Chất lượng output3

Giá3

Tốc độ3

Bảo mật3

Tích hợp3

Hỗ trợ tiếng Việt3

Demo 2: Ghép tác vụ với công cụ phù hợp

Click vào tác vụ ở cột A, rồi click công cụ ở cột B bạn nghĩ phù hợp nhất.

Ghép 5 tác vụ phổ biến ở văn phòng VN với công cụ AI phù hợp nhất.

Cột A

Cột B

Demo 3: Cùng prompt, ba công cụ trả lời khác nhau thế nào

Bấm qua từng tab để xem cách mỗi công cụ xử lý cùng một yêu cầu phân tích báo cáo doanh thu.

Cùng một prompt

"Tóm tắt báo cáo doanh thu Q1 2026: Doanh thu 45 tỷ (+12% YoY), lợi nhuận 8 tỷ (+5%), chi phí vận hành tăng 18%. Khách hàng mới 1,200 (giảm 8%). Đề xuất 3 hành động."

ChatGPT (GPT-4)

Điểm chính Q1/2026: Doanh thu tăng tốt (+12%), nhưng tăng chi phí (+18%) vượt tăng doanh thu → biên lợi nhuận mỏng đi. Khách hàng mới giảm 8% đáng lo.

≈ 340 ký tự, tốc độ ~2s

Bấm qua từng tab để so sánh

Giải thích

Framework 6 tiêu chí đánh giá

Chất lượng output

Câu trả lời có đúng, đầy đủ, đúng ngữ cảnh tiếng Việt không.

Giá

Chi phí theo tháng hoặc theo lượng query, bao gồm cả gói doanh nghiệp.

Tốc độ

Thời gian chờ câu trả lời. Quan trọng với chatbot khách hàng.

Bảo mật

Có cam kết không dùng dữ liệu của bạn để huấn luyện, DPA, audit log không.

Tích hợp

Có nối được với Google Workspace, Microsoft 365, Slack, hay phần mềm công ty.

Hỗ trợ tiếng Việt

Có giữ dấu đúng không, hiểu ngữ cảnh văn hóa Việt, có mất dấu ở output dài không.

Cách dùng framework

5 công cụ AI phổ biến, mạnh và yếu

ChatGPT

OpenAI

Free · Plus $20 · Team $25/user · Enterprise tùy

Mạnh

+Hệ sinh thái lớn nhất, nhiều tích hợp sẵn
+App mobile + voice mode tốt
+Tạo ảnh DALL-E ngay trong chat

Yếu

−Đôi khi mất dấu tiếng Việt ở bài dài
−Tier miễn phí lưu hội thoại có thể dùng để huấn luyện

Phù hợp: Work chung, tạo hình ảnh, tổng hợp đa phương tiện

Claude

Anthropic

Free · Pro $20 · Team $25/user · Enterprise tùy

Mạnh

+Viết + phân tích văn bản dài tốt, giữ dấu VN ổn định
+No-train mặc định ở mọi tier API
+Coding + reasoning mạnh ở benchmark mới nhất

Yếu

−Không tạo ảnh trực tiếp
−Hệ sinh thái plugin nhỏ hơn OpenAI

Phù hợp: Phân tích báo cáo dài, soạn thảo văn bản, code, tài liệu pháp lý

Gemini

Google

Free · AI Premium $20 · Workspace $20–30/user

Mạnh

+Rẻ nhất ở tier mid (Flash), tốc độ cao
+Tích hợp sâu Google Workspace (Docs, Sheets, Gmail)
+Context window lớn (2M token), xử lý được video/audio

Yếu

−Đôi khi code-switch sang tiếng Anh không chủ đích
−Safety classifier đôi lúc từ chối query hợp lệ

Phù hợp: Chatbot volume lớn, Google Workspace user, phân tích video/hình

Microsoft 365 Copilot

Microsoft

$30/user/tháng (kèm M365 Business)

Mạnh

+Tích hợp chặt Word, Excel, Outlook, Teams
+Zero Data Retention option, dữ liệu nằm trong tenant M365
+Đã có region Singapore gần Việt Nam

Yếu

−Bắt buộc phải có M365 Business, giá cao
−Chất lượng văn bản tự do kém hơn Claude/ChatGPT

Phù hợp: Công ty đã dùng M365, cần AI trong Word/Excel/Outlook

Perplexity

Perplexity AI

Free · Pro $20 · Enterprise $40/user

Mạnh

+Trích dẫn nguồn rõ ràng, tốt cho research
+Cập nhật thông tin realtime từ web
+Tìm thông tin thị trường VN khá ổn

Yếu

−Enterprise tier còn non, ít DPA mạnh
−Không tốt cho viết sáng tạo dài

Phù hợp: Nghiên cứu thị trường, tìm số liệu, fact-check

Tổng chi phí sở hữu (TCO), tính đủ 5 thành phần

Tổng chi phí sở hữu (TCO) không chỉ là giá API

Khi chọn AI tool, tính đủ 5 thành phần dưới. Tỉ lệ dưới đây là phân bố điển hình cho một dự án AI nội bộ năm đầu tiên ở công ty vừa và nhỏ.

30%

15%

25%

10%

20%

Giá API / subscription

30%

Chi phí trực tiếp trả cho vendor theo tháng hoặc theo token

Hạ tầng đi kèm

15%

Vector DB, orchestration, monitoring, caching, thường bị quên

Công sức kỹ sư

25%

Viết prompt, integrate SDK, xây eval set, fine-tune, maintain

Độ trễ người dùng

10%

Latency cao = user bỏ đi. Mỗi +100ms giảm conversion ~1%

Chi phí migrate sau này

20%

Đổi vendor = viết lại prompt + re-eval + đào tạo lại team

6 dấu hiệu đỏ khi chọn AI cho công ty

Chưa có trên thị trường VN

Công cụ chưa có thanh toán bằng thẻ VN, chưa có hóa đơn VAT, chưa có gói doanh nghiệp ở region châu Á, sẽ khó triển khai cho team ở VN.

Không có gói trả phí rõ ràng

Chỉ có tier miễn phí, không có Team/Enterprise tier → không thể ký DPA, không có cam kết no-train, không có audit log. Không dùng cho dữ liệu công ty.

Bảo mật mập mờ

Website không nói rõ có dùng dữ liệu để huấn luyện không, không có trang trust center, không có chứng chỉ SOC 2 / ISO 27001. Tránh.

Chỉ có benchmark nội bộ

Nhà cung cấp chỉ công bố điểm benchmark nội bộ. Chưa có đánh giá độc lập từ LMSYS Arena hoặc HELM.

Không rõ ai đứng sau

Công ty không rõ, không có địa chỉ đăng ký, team nhỏ không xác minh được. Nguy cơ ngừng dịch vụ bất ngờ, dữ liệu mất.

Khóa vendor lock-in nặng

Fine-tune, dataset, prompt format đều độc quyền, sau này muốn đổi phải viết lại từ đầu. Chọn công cụ có portable format.

Cây quyết định: 5 tình huống văn phòng VN phổ biến

Bấm qua từng tab để xem gợi ý công cụ cho từng loại tác vụ.

Soạn email + tài liệu trong Word/Outlook

Ưu tiên: Tích hợp (5/5), bảo mật (5/5), tiếng Việt (4/5)

Chọn: Microsoft 365 Copilot, nếu công ty đã có M365. Nếu chưa, dùng Claude for Work + copy sang Word.

Lý do: Copilot hiểu cấu trúc Word/Outlook, dữ liệu nằm trong tenant công ty, có Zero Data Retention.

3 sai lầm phổ biến khi chọn AI

1. Chạy theo hype: Tool mới ra luôn được ca ngợi. Chờ 4–8 tuần, đợi benchmark độc lập và feedback cộng đồng trước khi dùng cho production.

Kiểm tra hiểu biết

Câu 1/6

Bạn cần chọn AI cho 50 nhân viên văn phòng chủ yếu dùng Word và Outlook cho tài liệu và email khách hàng. Chọn tool nào phù hợp nhất?