ai-safety

Bias & Fairness

Bias và fairness: AI học cả định kiến

Độ khóbeginner

Một mô hình AI dự đoán khả năng trả nợ được huấn luyện trên dữ liệu 10 năm qua của ngân hàng. Theo bạn, ai sẽ bị đánh giá thấp nhất?

1Gương chiếu quá khứ

Hãy hình dung AI như một tấm gương chiếu. Nó không tự tạo ra ai, không tự có ý kiến, nó chỉ phản chiếu lại những gì đã xảy ra trong dữ liệu 10 năm qua của công ty bạn.

Nếu 10 năm qua ngân hàng ít duyệt vay cho phụ nữ làm nội trợ, tấm gương sẽ nói: “nội trợ = rủi ro cao”. Nếu công ty công nghệ ít tuyển người trên 40 tuổi, tấm gương sẽ nói: “40+ = ít phù hợp”. Không phải vì tấm gương ác ý, mà vì đó là tất cả những gì nó từng thấy.

Khác biệt lớn nhất giữa AI và con người

Một nhân viên HR có định kiến có thể sàng 20 CV mỗi ngày. Một mô hình AI có định kiến sàng 20.000 CV mỗi ngày, cùng một định kiến, áp dụng ở tầm công nghiệp, và không ai kịp kiểm tra từng quyết định.

Hình minh họa

2Demo 1, Kéo thanh để xem thiên kiến hình thành

Kéo thử thanh “tỷ lệ nữ trong dữ liệu” xuống thấp, rồi tăng “mức thiên lệch của mô hình”. Quan sát hai thanh ngang thay đổi.

Mô phỏng AI tuyển dụng học từ dữ liệu lịch sử

Tỷ lệ được AI đề xuất tuyển (dự đoán)

MỨng viên nam51%

FỨng viên nữ14%

Chênh lệch: 37 điểm phần trăm

Rủi ro cao, AI đang phân biệt rõ rệt

Tỷ lệ nữ trong dữ liệu tuyển 10 năm qua22%

5%50%

Mức thiên lệch mà mô hình tự học18%

0%40%

3Demo 2, Xoá cột Giới tính là chưa đủ

Nhiều công ty tin rằng bỏ cột giới tính khỏi dữ liệu là đủ. Thực tế, thông tin giới tính rò rỉ qua tên, trường học, nghề cũ. Chuyển qua lại giữa hai cách làm sạch dữ liệu để so sánh.

Kéo thử giữa hai cách làm sạch dữ liệu. Chú ý cột nào vẫn còn 'ro rỉ' thông tin nhạy cảm.

Độ chính xác mô hình87%

Chênh lệch nam - nữ28 điểm %

Tên ứng viênRÒ RỈ

“Nguyễn Thị Mai, đoán 92% là nữ”

Trường họcRÒ RỈ

“"Đại học Phụ nữ", đoán 99% là nữ”

Công việc cũRÒ RỈ

“"Nội trợ trước 2018", đoán 96% là nữ”

Kết quả

Mô hình vẫn biết giới tính qua đường vòng. Chênh lệch tuyển dụng gần như không giảm dù đã bỏ cột Giới tính.

4Demo 3, Phân loại 8 ví dụ thực tế

Kéo từng ví dụ dưới đây vào đúng loại thiên kiến. Đây là 8 tình huống có thật trong môi trường văn phòng Việt Nam.

Kéo từng ví dụ vào đúng loại thiên kiến. Một mục chỉ thuộc một loại.

Mô hình chấm điểm tín dụng chỉ được huấn luyện trên khách hàng Hà Nội và TP.HCM

Chatbot AI được dạy từ toàn bộ câu hỏi của sinh viên Bách Khoa

AI duyệt vay học tập học rằng nữ ít có khả năng trả nợ vì 10 năm trước phụ nữ ít người đi làm

AI sàng lọc CV ưu tiên ứng viên từng là 'đội trưởng', từ khoá ít xuất hiện trong CV nữ

Hệ thống chấm điểm hiệu suất dùng 'số giờ online Teams' để đo năng suất

AI y tế dự đoán bệnh tim chỉ dùng triệu chứng phổ biến ở nam, bỏ sót triệu chứng ở nữ

Công cụ dịch tiếng Anh cho phòng marketing lại được dùng luôn cho hợp đồng pháp lý

AI nhận diện khuôn mặt huấn luyện ở Mỹ được lắp vào cửa văn phòng tại Việt Nam, sai nhiều hơn với người bản địa

Sampling bias (mẫu lệch)

Historical bias (lịch sử)

Measurement bias (đo sai)

Deployment bias (lạm dụng ngữ cảnh)

Xoá cột “giới tính” khỏi dữ liệu không làm cho AI công bằng hơn, mà chỉ làm cho sự thiên kiến khó phát hiện hơn. Tên, trường học, địa chỉ, nghề cũ đều có thể rò rỉ cùng một thông tin. Công bằng thật sự đòi hỏi đo đạc kết quả, không phải giả vờ không nhìn thấy.

Trong bốn tình huống văn phòng sau, tình huống nào có RỦI RO PHÁP LÝ VÀ ĐẠO ĐỨC CAO NHẤT khi dùng AI?

Giải thích

5Bốn loại thiên kiến bạn sẽ gặp trong văn phòng

Thiên kiến lấy mẫu

Sampling bias

Bản chất: Dữ liệu huấn luyện không đại diện cho toàn bộ dân số thật. AI chỉ 'biết' những nhóm nó từng thấy.

Ví dụ: Mô hình tuyển dụng huấn luyện 90% từ ứng viên Hà Nội & TP.HCM, đoán sai với miền Trung.

Thiên kiến lịch sử

Historical bias

Bản chất: Dữ liệu chính xác, nhưng phản ánh một xã hội bất bình đẳng. AI tái tạo quá khứ đó.

Ví dụ: Ngân hàng 10 năm qua duyệt vay ít cho phụ nữ, AI học rằng 'phụ nữ = rủi ro'.

Thiên kiến đo lường

Measurement bias

Bản chất: Cách đo 'kết quả' sai lệch giữa các nhóm. Thước đo không phải là sự thật.

Ví dụ: Đánh giá năng suất bằng "giờ online", bất lợi cho ai làm việc hiệu quả nhưng ngắn thời gian.

Thiên kiến triển khai

Deployment bias

Bản chất: AI dùng đúng ở ngữ cảnh này lại sai ở ngữ cảnh khác. Huấn luyện một nơi, triển khai một nẻo.

Ví dụ: Nhận diện khuôn mặt huấn luyện ở Mỹ, lắp ở Việt Nam sai nhiều hơn với người bản địa.

6Ba cách đo công bằng, minh hoạ bằng thanh phần trăm

Không có một định nghĩa “công bằng” duy nhất. Có ba cách đo phổ biến, mỗi cách trả lời một câu hỏi khác nhau. Dưới đây là cách chúng hoạt động trên cùng một mô hình tuyển dụng.

Đồng đều tỷ lệ (Demographic Parity)

Tỷ lệ được chọn bằng nhau, bất kể năng lực

Câu hỏi: 'Bạn có nhận đủ nam và nữ vào công ty không?', chỉ nhìn số lượng tổng.

Nhóm A (đa số)

Tỷ lệ tuyển62%

Nhóm B (thiểu số)

Tỷ lệ tuyển61%

Đạt: hai cột gần bằng nhau. Nhưng không đảm bảo AI chọn đúng người, có thể đang tuyển đủ số lượng nhưng sai chất lượng để 'bù đắp'.

Đồng đều cơ hội (Equal Opportunity)

Trong số người THẬT SỰ phù hợp, tỷ lệ được AI chọn bằng nhau

Câu hỏi: 'Trong số ứng viên xứng đáng, bao nhiêu % được AI chấp nhận?', chỉ đo trên nhóm có năng lực.

Nhóm A (đa số)

Người xứng đáng được chọn85%

Tỷ lệ tổng62%

Nhóm B (thiểu số)

Người xứng đáng được chọn84%

Tỷ lệ tổng41%

Đạt: 85% và 84% gần bằng nhau ở thanh trên. Tỷ lệ tổng chênh vì nhóm B ít người xứng đáng, không phải bất công từ AI.

Đồng đều sai sót (Equalized Odds)

Cả tỷ lệ chọn đúng và chọn sai phải bằng nhau

Câu hỏi kép: 'AI có ưu ái một nhóm theo hai hướng, chọn nhiều hơn cả người xứng đáng LẪN người không xứng đáng?'

Nhóm A (đa số)

Chọn đúng (TPR)85%

Chọn sai (FPR)28%

Nhóm B (thiểu số)

Chọn đúng (TPR)70%

Chọn sai (FPR)12%

Chưa đạt: nhóm A cao hơn ở cả hai thanh, AI đang 'dễ tính' với A và 'khó tính' với B. Đây là tiêu chí nghiêm ngặt nhất.

7Bộ công cụ giảm thiên kiến

Nối từng kỹ thuật với tình huống phù hợp. Mỗi kỹ thuật giải quyết một lớp vấn đề khác nhau, không có viên đạn bạc.

Bấm vào một ô Cột A, rồi bấm vào ô Cột B tương ứng.

Cột A

Cột B

8Quy tắc vàng cho văn phòng Việt

Luôn audit trước triển khai

Đo chênh lệch kết quả theo giới tính, độ tuổi, vùng miền trên dữ liệu Việt Nam thật, không chỉ demo của vendor.

Không bao giờ để AI tự quyết một mình

Với quyết định ảnh hưởng đến sinh kế (tuyển dụng, sa thải, lương, cho vay), AI chỉ được ĐỀ XUẤT. Con người ký duyệt và giải thích.

Có kênh khiếu nại

Người bị ảnh hưởng phải có quyền hỏi: “Vì sao tôi bị từ chối?” và được con người phúc tra trong thời gian hợp lý.

Định lý bất khả thi

Một sự thật toán học khó chịu: không thể đồng thời đạt cả ba tiêu chí công bằng (đồng đều tỷ lệ, đồng đều cơ hội, đồng đều sai sót) khi tỷ lệ nền của các nhóm khác nhau. Tổ chức BUỘC phải chọn tiêu chí ưu tiên và ghi lại lý do, đây là trách nhiệm đạo đức, không phải bài toán kỹ thuật.

5 điều nhân viên văn phòng cần nhớ về thiên kiến AI

AI là tấm gương chiếu quá khứ, quá khứ bất bình đẳng thì AI cũng bất bình đẳng, chỉ có điều ở tầm công nghiệp.
Bỏ cột 'giới tính' không làm AI công bằng, tên, trường, nghề cũ vẫn rò rỉ thông tin. Phải đo kết quả, không che dữ liệu.
Bốn loại thiên kiến: lấy mẫu (sampling), lịch sử (historical), đo lường (measurement), triển khai (deployment). Mỗi loại có cách xử lý riêng.
Ba cách đo công bằng trả lời ba câu hỏi khác nhau, không thể đạt tất cả cùng lúc, phải chọn và ghi lại lý do.
Ở Việt Nam: Nghị định 13/2023, Luật An ninh mạng, Điều 8 Bộ luật Lao động đều áp dụng cho quyết định do AI đưa ra. Trách nhiệm cuối cùng vẫn thuộc về doanh nghiệp.

Kiểm tra hiểu biết

Câu 1/8

Vì sao AI có thể mang thiên kiến dù bản thân nó 'không có ý thức'?

Chủ đề liên quan

Explainability (XAI): Explainability: bắt AI giải thích quyết định AI Governance: AI governance: quy trình dùng AI an toàn trong công ty AI Alignment: Căn chỉnh AI. Dạy AI hiểu con người