Sentiment Analysis
Phân tích cảm xúc văn bản
Khách hàng viết trên Facebook: "Giao hàng nhanh, sản phẩm tốt nhưng đóng gói hơi sơ sài". Bạn sẽ gắn nhãn gì cho bình luận này?
Hãy nhớ lại lúc bạn lướt Facebook xem khách bình luận trên trang của công ty mình. Chỉ cần liếc qua là bạn biết khách đang khen, chê, hay chỉ hỏi giá. Bộ não bạn đọc mấy chục bình luận/phút đã mệt — AI làm đúng việc đó cho hàng triệu bình luận mỗi giờ, liên tục, không cần cà phê.
Tích cực
"Shop nhiệt tình, hàng đẹp, sẽ quay lại!"
Tiêu cực
"Giao hàng chậm, sản phẩm bị lỗi, thất vọng."
Trung tính
"Shop còn size M không ạ?"
Một trang Facebook của ngân hàng có thể nhận 30.000 bình luận/ngày. Một thương hiệu Shopee top 100 có 500.000 review đang tồn. Không đội nhân sự nào đọc nổi. AI làm việc gom nhóm khen–chê theo giờ để bạn biết lúc nào cần vào cứu lửa.
Hình minh họa
Demo 1 · Máy đọc bình luận của bạn
Gõ một bình luận tiếng Việt bất kỳ. Máy tô từ tích cực (xanh), tiêu cực (đỏ), và từ đảo ngữ như “không” (cam) — rồi tổng hợp thành một nhãn.
Máy đang nhìn
phởhànộirấtngon,shopgóicẩnthận!
Demo 2 · Dashboard cảm xúc theo tuần (mô phỏng Shopee / Lazada / Tiki)
15 review giả trong 7 ngày, đã được gán nhãn sẵn. Lọc theo sàn để xem thương hiệu của bạn đang ở đâu.
47%
Tích cực
20%
Trung tính
33%
Tiêu cực
Phân bố cảm xúc theo ngày
T2
T3
T4
T5
T6
T7
CN
Sản phẩm rất tốt, ship nhanh, đóng gói cẩn thận!
Tích cựcHàng đúng mô tả, chất lượng ổn so với giá tiền
Trung tínhGiao chậm, sản phẩm bị lỗi, không hài lòng
Tiêu cựcPhở này ngon tuyệt vời, sẽ mua lại!
Tích cựcKhi nhãn tiêu cực vọt lên 30%+ trong vài giờ, đội truyền thông nhận cảnh báo ngay. Đó chính là lý do Brandwatch hay YouNet Media bán được nhiều: AI phát hiện khủng hoảng trước khi báo chí đăng.
Demo 3 · Khi máy dễ đoán sai
Chọn một câu khó, đoán xem máy đếm-từ sẽ ra kết quả gì, rồi so với nghĩa thật.
“Không tệ, đáng tiền lắm”
Cảm xúc tiếng Việt không bao giờ chỉ là đếm từ xấu / từ đẹp. “Không tệ” là khen. “Nhiệt tình lắm nhé, nhắn ba ngày không rep” là chửi. Máy muốn hiểu đúng phải đọc cả câu, cả ngữ cảnh, và đôi khi cả emoji.
Đó là lý do các mô hình hiện đại (BERT, PhoBERT, LLM) thay thế cách làm cũ — chúng không đếm, chúng đọc.
Khách comment trên fanpage nhà hàng: "Món phở OK thôi, không có gì đặc biệt, nhưng nhân viên dễ thương". Nếu bạn làm aspect-based sentiment cho nhà hàng này, bạn sẽ gán?
Giải thích
Phân tích cảm xúc là một dạng riêng của phân loại văn bản — thay vì gán nhãn “thể thao / kinh tế”, ta gán nhãn “tích cực / tiêu cực”. Marketer cần hiểu ba dòng công nghệ sau để chọn đúng công cụ.
1. Từ điển (Lexicon)
Có một danh sách “từ tích cực” và “từ tiêu cực” sẵn. Máy đếm và so điểm.
Rẻ · nhanh
Trật với đảo ngữ, mỉa mai, phương ngữ.
2. Máy học cổ điển
Máy học từ vài nghìn review đã gắn nhãn (Naive Bayes, SVM, Logistic). Tốt hơn từ điển, vẫn chưa hiểu ngữ cảnh.
Độ chính xác 75–85% trong lĩnh vực quen.
3. LLM / BERT
Đọc cả câu, hiểu đảo ngữ, phát hiện mỉa mai. PhoBERT cho tiếng Việt, GPT-4 đa ngôn ngữ.
85–95% — tốt nhất hiện nay.
So sánh trực tiếp trên cùng câu tiếng Việt
Cùng một câu, hai cách đọc — bên nào giống đồng nghiệp của bạn hơn?
Dấu thanh
“chán” vs “chan” khác hẳn nghĩa. Mô hình không-có-dấu trật rất nhiều.
Phương ngữ
“Ngon lành cành đào” (Bắc), “hết sẩy” (Nam) — phải có dữ liệu cả ba miền.
Viết tắt mạng
“ko”, “đc”, “sl”, “ship”, “nv” — nếu tokenizer không biết là sai ngay.
Mỉa mai
“5 sao cho ship chậm” — cả BERT lẫn GPT vẫn hay sai.
Emoji & icon
❤️ ≠ 🙄. Emoji là tín hiệu cảm xúc cực mạnh, mô hình phải đọc được, không bỏ qua.
Marketer & dân văn phòng dùng phân tích cảm xúc ở đâu?
Giám sát thương hiệu
Theo dõi khen chê trên Facebook, TikTok, Shopee theo thời gian thực.
Đánh giá chiến dịch
Trước và sau campaign: tỉ lệ bình luận tích cực đã tăng bao nhiêu?
Phân tích khảo sát
Hàng nghìn câu trả lời tự luận của nhân viên hoặc khách — gom lại trong vài phút.
Cảnh báo khủng hoảng
Tiêu cực vọt 30% trong 2 giờ → đội PR nhận cảnh báo qua Slack.
Review nội bộ
Phân loại feedback hội thảo, eNPS, đánh giá 360°.
Insight sản phẩm
Aspect-based tách riêng: giá, chất lượng, ship, dịch vụ — để đội sản phẩm biết sửa gì trước.
Nối nhanh — kiểm tra cảm nhận của bạn
Nối mỗi review (Cột A) với nhãn đúng (Cột B).
Cột A
Cột B
- AI đọc bình luận rồi gán tích cực / tiêu cực / trung tính — giống bạn lướt Facebook, nhưng chạy ở quy mô triệu bình luận.
- Aspect-based tách riêng từng khía cạnh (món ăn, ship, giá) — giúp biết chỗ nào cần sửa trước.
- Từ điển đếm từ rẻ nhưng sai với đảo ngữ (‘không tệ’), mỉa mai, emoji.
- BERT / PhoBERT / LLM đọc cả câu, đạt 85–95% — mạnh nhất hiện nay với tiếng Việt.
- Ứng dụng văn phòng: giám sát thương hiệu, đánh giá chiến dịch, phân tích khảo sát, cảnh báo khủng hoảng.
Kiểm tra hiểu biết
Review Shopee: "Sản phẩm không tệ lắm" — cảm xúc là gì?