What is Machine Learning?
Machine Learning là gì?
Hai đầu bếp, một bát phở
Hãy tưởng tượng bạn đang tập nấu ăn…
Đầu bếp 1mở sách công thức, đọc từng dòng: “3 lít nước, 500g xương, 2 hoa hồi”. Làm đúng y bản in. Nấu xong có tô phở — đúng như sách ghi.
Đầu bếp 2 chưa bao giờ đọc sách. Cô ấy đứng bếp hàng trăm lần, nếm, chỉnh, nếm tiếp. Lần đầu mặn quá. Lần mười đỡ rồi. Lần một trăm thì khách khen nức nở.
Đầu bếp theo công thức
- 1.Mở sách: “Phở bò — 3 lít nước, 500g bò”.
- 2.Cân đúng, đo đúng, bỏ đúng lượng.
- 3.Ra đúng vị đã ghi trong sách.
Đầu bếp học từ nếm thử
Nồi thứ 1: quá mặn — ghi nhớ.
Không ai đọc công thức cho đầu bếp này. Cô ấy tự tích kinh nghiệm — càng nấu nhiều, càng chuẩn.
Bạn cần viết phần mềm cho bốn bài toán sau. Bài nào ML thường KHÔNG phải lựa chọn tốt hơn lập trình thường?
Hình minh họa
Cùng bài toán lọc email rác — hai cách khác nhau
Chạm vào hai tab để thấy cách mỗi phương pháp xử lý email rác.
Người viết phải tự nghĩ ra từng dấu hiệu và viết thành luật cứng. Máy chỉ làm theo.
Xem máy học dần — qua từng vòng
Máy không giỏi ngay. Nó đoán sai, bị sửa, đoán tốt hơn, lại sai, lại sửa… Hàng triệu lần. Bấm “Chạy thêm” để thấy quá trình:
Máy học đoán giá nước cam (theo ly)
Mục tiêu: đoán giá (nghìn đồng) của ba loại ly. Máy bắt đầu với số ngẫu nhiên, rồi mỗi vòng so với giá thật và tự điều chỉnh.
Ly nhỏ
Máy đoán
25k
Giá thật
15k
Lệch 10k
Ly vừa
Máy đoán
25k
Giá thật
25k
Lệch 0k
Ly to
Máy đoán
25k
Giá thật
40k
Lệch 15k
Bạn chọn: Lập trình thường hay ML?
Cho bốn bài toán dưới đây, theo bạn: nên dùng lập trình thường (viết luật if-else), hay Machine Learning (cho máy học từ ví dụ)?
Tính tiền điện
Mỗi kWh là 2.500 đồng. Tính tiền điện khi biết số kWh tiêu thụ trong tháng.
Chặn email rác
Hộp thư nhận 1000 email mỗi ngày. Phân biệt email thật và email rác — kiểu rác thay đổi liên tục.
Nhận ra mèo trong ảnh
Cho một ảnh bất kỳ, cần biết trong ảnh có con mèo hay không — không phụ thuộc giống, màu lông, tư thế.
Đặt lại thứ tự bài hát
Có danh sách 50 bài hát. Cần sắp xếp theo tên bài theo thứ tự a-b-c.
Đã làm 0/4
Bốn bước của mọi hệ thống ML
Từ Grab, Shopee đến ChatGPT — mọi hệ thống ML đều đi qua bốn bước này. Bấm “Tiếp tục” để mở từng bước:
Dữ liệu — nguyên liệu nấu ăn
Trước khi máy học được gì, phải có ví dụ. Với app nhận ảnh mèo: cần hàng triệu ảnh, mỗi ảnh có nhãn rõ “mèo” hay “không phải mèo”. Với Grab: cần log hàng triệu chuyến đi thật. Dữ liệu càng nhiều, càng chất lượng → máy học càng tốt.
Vòng học trực quan hóa
ML không “hiểu” theo kiểu con người.
Nó tìm ra pattern trong dữ liệu — và pattern đó chính là công thức ẩn mà không ai biết cách viết ra.
Đưa cho máy dữ liệu tốt → kết quả tốt.
Đưa rác → ra rác. Không có phép màu.
Trung tâm tiếng Anh muốn làm hệ thống chấm phát âm cho học viên. Bài toán phù hợp nhất với cách nào?
Bạn viết một app đếm số học sinh trong lớp từ ảnh camera. Lớp có đúng 40 học sinh luôn. Có nên dùng ML không?
Bạn có 20 ảnh X-quang để làm app phát hiện gãy xương. Bạn huấn luyện xong, máy đạt 100% đúng trên 20 ảnh đó. Đáng ăn mừng không?
Giải thích
Vậy Machine Learning không phải phép thuật. Nó là một cách tiếp cận khác — thay vì đi viết luật, ta thu thập ví dụ và để máy tự rút luật. Ba điểm cần nhớ:
Khi nào dùng
Pattern phức tạp không thể viết tay (ảnh, giọng nói, ngôn ngữ, hành vi người dùng). Có đủ dữ liệu. Sẵn lòng chấp nhận máy đôi khi sai.
Khi nào không dùng
Có công thức rõ ràng (tính thuế, đổi đơn vị). Không có dữ liệu. Sai là chết người và cần giải thích được từng quyết định.
Vị trí trong AI
AI là cái ô lớn. ML là một nhánh của AI — nhánh đông đúc nhất hiện nay. Deep Learning lại là một nhánh bên trong ML, dùng cho ảnh và ngôn ngữ.
- Grab đoán giá cước và thời gian tới nơi — học từ hàng triệu chuyến đi thật trên đường phố Việt Nam.
- Shopee gợi ý sản phẩm — học từ lịch sử bấm, mua, đánh giá của hàng triệu người dùng.
- TikTok đoán video tiếp theo bạn sẽ thích — học từ cách bạn vuốt, xem lâu, bấm tim.
Bạn vừa gặp khái niệm quan trọng nhất: ML học từ dữ liệu. Để đi tiếp, hãy xem những khái niệm toán cần biết (không đáng sợ như bạn nghĩ), rồi tìm hiểu dữ liệu được tổ chức thế nào — trái tim của mọi mô hình ML.
- ML = máy tự rút ra quy tắc từ ví dụ, thay vì người viết tay từng luật if-else.
- Giống đầu bếp học từ nếm thử, không đọc công thức — càng nhiều kinh nghiệm càng giỏi.
- Bốn bước: Dữ liệu → Học → Mô hình → Dự đoán (và phản hồi để học tiếp).
- Dùng ML khi pattern phức tạp và có dữ liệu. Đừng dùng khi công thức đã rõ.
- Rác vào, rác ra — chất lượng dữ liệu quyết định mọi thứ.
Kiểm tra hiểu biết
Sự khác biệt cơ bản giữa lập trình thường và Machine Learning là gì?