nlp

Sentiment Analysis

Sentiment analysis: đọc cảm xúc trong bình luận

Độ khóintermediate

1Dự đoán1/8

Khách hàng viết trên Facebook: "Giao hàng nhanh, sản phẩm tốt nhưng đóng gói hơi sơ sài". Bạn sẽ gắn nhãn gì cho bình luận này?

2Ẩn dụ2/8

Hãy nhớ lại lúc bạn lướt Facebook xem khách bình luận trên trang của công ty mình. Chỉ cần liếc qua là bạn biết khách đang khen, chê, hay chỉ hỏi giá. Bộ não bạn đọc mấy chục bình luận/phút đã mệt, AI làm đúng việc đó cho hàng triệu bình luận mỗi giờ, liên tục, không cần cà phê.

Tích cực

"Shop nhiệt tình, hàng đẹp, sẽ quay lại!"

Tiêu cực

"Giao hàng chậm, sản phẩm bị lỗi, thất vọng."

Trung tính

"Shop còn size M không ạ?"

Vì sao marketer cần AI cho việc này?

Một trang Facebook của ngân hàng có thể nhận 30.000 bình luận/ngày. Một thương hiệu Shopee top 100 có 500.000 review đang tồn. Không đội nhân sự nào đọc nổi. AI làm việc gom nhóm khen–chê theo giờ để bạn biết lúc nào cần vào cứu lửa.

3Trực quan hóa3/8

Hình minh họa

Demo 1 · Máy đọc bình luận của bạn

Gõ một bình luận tiếng Việt bất kỳ. Máy tô từ tích cực (xanh), tiêu cực (đỏ), và từ đảo ngữ như “không” (cam), rồi tổng hợp thành một nhãn.

Máy đang nhìn

phởhànộirấtngon,shopgóicẩnthận!

Tích cực: 1Tiêu cực: 0Đảo ngữ

Rất tiêu cựcTrung tínhRất tích cực

Tích cực100%

Trung tính89%

Tiêu cực0%

Demo 2 · Dashboard cảm xúc theo tuần (mô phỏng Shopee / Lazada / Tiki)

15 review giả trong 7 ngày, đã được gán nhãn sẵn. Lọc theo sàn để xem thương hiệu của bạn đang ở đâu.

47%

Tích cực

20%

Trung tính

33%

Tiêu cực

Phân bố cảm xúc theo ngày

Shopee

Sản phẩm rất tốt, ship nhanh, đóng gói cẩn thận!

Tích cực

Shopee

Hàng đúng mô tả, chất lượng ổn so với giá tiền

Trung tính

Lazada

Giao chậm, sản phẩm bị lỗi, không hài lòng

Tiêu cực

Shopee

Phở này ngon tuyệt vời, sẽ mua lại!

Tích cực

Trong thực tế

Khi nhãn tiêu cực vọt lên 30%+ trong vài giờ, đội truyền thông nhận cảnh báo ngay. Đó chính là lý do Brandwatch hay YouNet Media bán được nhiều: AI phát hiện khủng hoảng trước khi báo chí đăng.

Demo 3 · Khi máy dễ đoán sai

Chọn một câu khó, đoán xem máy đếm-từ sẽ ra kết quả gì, rồi so với nghĩa thật.

“Không tệ, đáng tiền lắm”

Câu 1 / 6

4Khoảnh khắc Aha4/8

Cảm xúc tiếng Việt không bao giờ chỉ là đếm từ xấu / từ đẹp. “Không tệ” là khen. “Nhiệt tình lắm nhé, nhắn ba ngày không rep” là chửi. Máy muốn hiểu đúng phải đọc cả câu, cả ngữ cảnh, và đôi khi cả emoji.

Đó là lý do các mô hình hiện đại (BERT, PhoBERT, LLM) thay thế cách làm cũ, chúng không đếm, chúng đọc.

5Thử thách nhanh5/8

Khách comment trên fanpage nhà hàng: "Món phở OK thôi, không có gì đặc biệt, nhưng nhân viên dễ thương". Nếu bạn làm aspect-based sentiment cho nhà hàng này, bạn sẽ gán?

6Giải thích6/8

Giải thích

Phân tích cảm xúc là một dạng riêng của phân loại văn bản , thay vì gán nhãn “thể thao / kinh tế”, ta gán nhãn “tích cực / tiêu cực”. Marketer cần hiểu ba dòng công nghệ sau để chọn đúng công cụ.

1. Từ điển (Lexicon)

Có một danh sách “từ tích cực” và “từ tiêu cực” sẵn. Máy đếm và so điểm.

Rẻ · nhanh

Trật với đảo ngữ, mỉa mai, phương ngữ.

2. Máy học cổ điển

Máy học từ vài nghìn review đã gắn nhãn (Naive Bayes, SVM, Logistic). Tốt hơn từ điển, vẫn chưa hiểu ngữ cảnh.

Độ chính xác 75–85% trong lĩnh vực quen.

3. LLM / BERT

Đọc cả câu, hiểu đảo ngữ, phát hiện mỉa mai. PhoBERT cho tiếng Việt, GPT-4 đa ngôn ngữ.

85–95%, tốt nhất hiện nay.

So sánh trực tiếp trên cùng câu tiếng Việt

Cùng một câu, hai cách đọc, bên nào giống đồng nghiệp của bạn hơn?

Không tệ lắmTiêu cực ✗

Phở dở òmTiêu cực ✓

Haha hàng giả chất lượng cao quáTích cực ✗

Ship siêu nhanh 🙄Tích cực ✗

Năm cái bẫy đặc trưng của tiếng Việt

Dấu thanh

“chán” vs “chan” khác hẳn nghĩa. Mô hình không-có-dấu trật rất nhiều.

Phương ngữ

“Ngon lành cành đào” (Bắc), “hết sẩy” (Nam), phải có dữ liệu cả ba miền.

Viết tắt mạng

“ko”, “đc”, “sl”, “ship”, “nv”, nếu tokenizer không biết là sai ngay.

Mỉa mai

“5 sao cho ship chậm”, cả BERT lẫn GPT vẫn hay sai.

Emoji & icon

❤️ ≠ 🙄. Emoji là tín hiệu cảm xúc cực mạnh, mô hình phải đọc được, không bỏ qua.

Marketer & dân văn phòng dùng phân tích cảm xúc ở đâu?

Giám sát thương hiệu

Theo dõi khen chê trên Facebook, TikTok, Shopee theo thời gian thực.

Đánh giá chiến dịch

Trước và sau campaign: tỉ lệ bình luận tích cực đã tăng bao nhiêu?

Phân tích khảo sát

Hàng nghìn câu trả lời tự luận của nhân viên hoặc khách, gom lại trong vài phút.

Cảnh báo khủng hoảng

Tiêu cực vọt 30% trong 2 giờ → đội PR nhận cảnh báo qua Slack.

Review nội bộ

Phân loại feedback hội thảo, eNPS, đánh giá 360°.

Insight sản phẩm

Aspect-based tách riêng: giá, chất lượng, ship, dịch vụ, để đội sản phẩm biết sửa gì trước.

Nối nhanh, kiểm tra cảm nhận của bạn

Nối mỗi review (Cột A) với nhãn đúng (Cột B).

Cột A

Cột B

7Tóm tắt7/8

Ghi nhớ về phân tích cảm xúc

AI đọc bình luận rồi gán tích cực / tiêu cực / trung tính, giống bạn lướt Facebook, nhưng chạy ở quy mô triệu bình luận.
Aspect-based tách riêng từng khía cạnh (món ăn, ship, giá), giúp biết chỗ nào cần sửa trước.
Từ điển đếm từ rẻ nhưng sai với đảo ngữ (‘không tệ’), mỉa mai, emoji.
BERT / PhoBERT / LLM đọc cả câu, đạt 85–95%, mạnh nhất hiện nay với tiếng Việt.
Ứng dụng văn phòng: giám sát thương hiệu, đánh giá chiến dịch, phân tích khảo sát, cảnh báo khủng hoảng.

8Kiểm tra8/8

Kiểm tra hiểu biết

Câu 1/5

Review Shopee: "Sản phẩm không tệ lắm", cảm xúc là gì?

Chủ đề liên quan

Text Classification: Text classification: gắn nhãn cho tin nhắn Naive Bayes: Naive Bayes: cộng dồn bằng chứng từng từ BERT: BERT - Biểu diễn mã hoá hai chiều

Hình minh họa

Demo 1 · Máy đọc bình luận của bạn

Gõ một bình luận tiếng Việt bất kỳ. Máy tô từ tích cực (xanh), tiêu cực (đỏ), và từ đảo ngữ như “không” (cam), rồi tổng hợp thành một nhãn.

Máy đang nhìn

phởhànộirấtngon,shopgóicẩnthận!

Tích cực: 1Tiêu cực: 0Đảo ngữ

Rất tiêu cựcTrung tínhRất tích cực

Tích cực100%

Trung tính89%

Tiêu cực0%

Demo 2 · Dashboard cảm xúc theo tuần (mô phỏng Shopee / Lazada / Tiki)

15 review giả trong 7 ngày, đã được gán nhãn sẵn. Lọc theo sàn để xem thương hiệu của bạn đang ở đâu.

47%

Tích cực

20%

Trung tính

33%

Tiêu cực

Phân bố cảm xúc theo ngày

Shopee

Sản phẩm rất tốt, ship nhanh, đóng gói cẩn thận!

Tích cực

Shopee

Hàng đúng mô tả, chất lượng ổn so với giá tiền

Trung tính

Lazada

Giao chậm, sản phẩm bị lỗi, không hài lòng

Tiêu cực

Shopee

Phở này ngon tuyệt vời, sẽ mua lại!

Tích cực

Trong thực tế

Demo 3 · Khi máy dễ đoán sai

Chọn một câu khó, đoán xem máy đếm-từ sẽ ra kết quả gì, rồi so với nghĩa thật.

“Không tệ, đáng tiền lắm”

Câu 1 / 6

Giải thích

1. Từ điển (Lexicon)

Có một danh sách “từ tích cực” và “từ tiêu cực” sẵn. Máy đếm và so điểm.

Rẻ · nhanh

Trật với đảo ngữ, mỉa mai, phương ngữ.

2. Máy học cổ điển

Máy học từ vài nghìn review đã gắn nhãn (Naive Bayes, SVM, Logistic). Tốt hơn từ điển, vẫn chưa hiểu ngữ cảnh.

Độ chính xác 75–85% trong lĩnh vực quen.

3. LLM / BERT

Đọc cả câu, hiểu đảo ngữ, phát hiện mỉa mai. PhoBERT cho tiếng Việt, GPT-4 đa ngôn ngữ.

85–95%, tốt nhất hiện nay.

So sánh trực tiếp trên cùng câu tiếng Việt

Cùng một câu, hai cách đọc, bên nào giống đồng nghiệp của bạn hơn?

Không tệ lắmTiêu cực ✗

Phở dở òmTiêu cực ✓

Haha hàng giả chất lượng cao quáTích cực ✗

Ship siêu nhanh 🙄Tích cực ✗

Năm cái bẫy đặc trưng của tiếng Việt

Dấu thanh

“chán” vs “chan” khác hẳn nghĩa. Mô hình không-có-dấu trật rất nhiều.

Phương ngữ

“Ngon lành cành đào” (Bắc), “hết sẩy” (Nam), phải có dữ liệu cả ba miền.

Viết tắt mạng

“ko”, “đc”, “sl”, “ship”, “nv”, nếu tokenizer không biết là sai ngay.

Mỉa mai

“5 sao cho ship chậm”, cả BERT lẫn GPT vẫn hay sai.

Emoji & icon

❤️ ≠ 🙄. Emoji là tín hiệu cảm xúc cực mạnh, mô hình phải đọc được, không bỏ qua.

Marketer & dân văn phòng dùng phân tích cảm xúc ở đâu?

Giám sát thương hiệu

Theo dõi khen chê trên Facebook, TikTok, Shopee theo thời gian thực.

Đánh giá chiến dịch

Trước và sau campaign: tỉ lệ bình luận tích cực đã tăng bao nhiêu?

Phân tích khảo sát

Hàng nghìn câu trả lời tự luận của nhân viên hoặc khách, gom lại trong vài phút.

Cảnh báo khủng hoảng

Tiêu cực vọt 30% trong 2 giờ → đội PR nhận cảnh báo qua Slack.

Review nội bộ

Phân loại feedback hội thảo, eNPS, đánh giá 360°.

Insight sản phẩm

Aspect-based tách riêng: giá, chất lượng, ship, dịch vụ, để đội sản phẩm biết sửa gì trước.

Nối nhanh, kiểm tra cảm nhận của bạn

Nối mỗi review (Cột A) với nhãn đúng (Cột B).

Cột A

Cột B