Tìm hiểu về sự khác biệt giữa Artificial Intelligence, Machine Learning Và Data Science

Vài năm gần đây, chúng ta thấy tivi, báo chí hay đưa tin về cuộc cách mạng công nghệ 4.0 với những khái niệm như trí tuệ nhân tạo, học máy, khoa học dữ liệu,… Những thuật ngữ này nghe rất kêu nhưng không phải ai cũng hiểu rõ chúng là gì, khác nhau như thế nào. Là một người làm trong mảng khoa học dữ liệu, mình muốn chia sẻ một chút để giúp mọi người hiểu rõ hơn về những khái niệm này.

Trí tuệ nhân tạo (Artificial Intelligence – AI) là những hệ thống được con người tạo ra với mục tiêu để mô phỏng các chức năng nhận thức của con người, ví dụ như khả năng nghe, nhìn, tư duy và ra quyết định.

Một số ví dụ về AI trong thực tiễn:

  • Camera nhận dạng khuôn mặt: như hệ thống Face ID của iPhone
  • Phần mềm phiên dịch: ví dụ như Google Translate
  • Chatbot (hệ thống trả lời tin nhắn tự động)

Học máy (Machine Learning – ML) là mảng nghiên cứu về kỹ thuật để giúp máy tính có khả năng tự học thay vì cần sự điều chỉnh bởi con người. Có thế nói ML là một phần của AI bên cạnh các công cụ, kỹ thuật khác.

Một dạng phổ biến của ML là “học” trên dữ liệu hiện có, rồi áp dụng lên dữ liệu mới. Ví dụ như:

  • Xác định tên của người trong ảnh, sau khi đã “học” về một bộ dữ liệu ảnh gồm tên người và ảnh của người đó. Bạn có để ý mỗi lần post ảnh lên Facebook là nó lại tự động tag không? Đấy chính là một sản phẩm của ML.
  • Dự đoán xem khách hàng có mua sản phẩm hay không, sau khi đã “học” dữ liệu về hành vi khách hàng để đưa ra chiến lược Marketing phù hợp cho từng đối tượng khách hàng.

Hầu hết các hệ thống AI hiện nay đều sử dụng ML nên 2 khái niệm này rẩt dễ bị nhầm lẫn với nhau. Nhưng lưu ý là vẫn có những hệ thống AI không sử dụng ML. Ví dụ như chatbot Eliza được phát triển năm 1966. Đây được coi là chatbot đầu tiên có khả năng trả lời rất giống con người. Chatbot khi đó được tạo ra bằng 1 loạt các quy tắc sẵn có như:

  • Nếu thấy cụm từ “ở đâu” thì bot nên trả lời về địa điểm.
  • Nếu thấy cụm từ “thời tiết” thì bot nên trả lời các thông tin về thời tiết (như nhiệt độ, mưa hay không mưa,…).

Gần đây cũng bắt đầu có nhiều loại chatbot dựa trên ML, tức là bot sẽ tự biết nên trả lời thế nào (mà không cần quy tắc định sẵn nữa) sau khi “học” dữ liệu về các đoạn hội thoại. Nhưng theo mình thấy những chatbot dựa trên các quy tắc vẫn là phổ biến nhất. Mà thôi không lan man quá về chủ đề này, hôm nào rảnh mình sẽ chia sẻ sâu hơn về chatbot.

Khoa học dữ liệu (Data Science – DS) là chuyên ngành về phân tích dữ liệu với mục tiêu hỗ trợ cho việc ra các quyết định trong nhiều lĩnh vực như nghiên cứu, sản xuất, kinh doanh,…

Ví dụ như trong kinh doanh, sản phẩm của DS có thể là:

  • Một báo cáo về tập khách hàng tiềm năng, từ đó phát triển chiến dịch quảng cáo cho nhóm khách hàng này.
  • Một báo cáo về những nguyên nhân chính mà khách hàng không gia hạn hợp đồng, từ đó phát triển chiến lược phù hợp để giữ chân khách hàng.
  • Một hệ thống xác định những sản phẩm mà khách hàng hay mua cùng nhau, sau đó tự động tiếp thị bằng email với mục tiêu bán chéo sản phẩm.

ML là một trong những kỹ năng được dùng trong DS. Lấy ví dụ ở trên, để tìm ra tập khách hàng tiềm năng, ML được áp dụng để ước tính khả năng mua sản phẩm của từng cá nhân (ví dụ: khả năng mua sản phẩm X của anh A là 90%), sau đó tổng hợp lại những người có khả năng mua cao nhất mà chưa phải khách hàng hiện tại để tìm cách thu hút người đó mua sản phẩm.

Bên cạnh đó DS còn bao gồm nhiều kỹ năng khác như xử lý dữ liệu, thống kê, lập trình,… Nhưng có lẽ do ML liên quan đến việc dự đoán tương lai, nghe “nguy hiểm” hơn hẳn mấy kỹ năng kia nên ML thường được nhắc đến nhiều hơn.


Nhìn chung, trí tuệ nhân tạo thường được nhắc đến khi nói về sự tự động hóa, còn khoa học dữ liệu thì thường được dùng để hỗ trợ quá trình phân tích và việc ra quyết định. Hai mảng này có những công cụ/ kỹ thuật giống nhau và học máy là một trong số đó.

Nếu bạn nghe ai đó nói rằng họ đang làm về những công nghệ này, bạn có thể hỏi thêm để hiểu rõ hơn chính xác đó là gì, đôi khi sẽ biết ngay đấy là “chém” hay là thật:

  • AI đấy giải quyết vấn đề gì? Dùng công nghệ gì? Có dùng ML hay không?
  • ML này dự đoán cái gì? Dựa trên dữ liệu như thế nào?
  • Dự án khoa học dữ liệu này phân tích cái gì? Tạo ra báo cáo hay phần mềm gì? Mang lại giá trị như thế nào?

Hy vọng là bài chia sẻ này giúp các bạn hiểu thêm phần nào về những khái niệm đang “hot” trong thời buổi công nghệ 4.0. Nếu có chủ đề nào mà các bạn quan tâm, các bạn cứ comment ở dưới nhé, mình sẽ tìm hiểu và chia sẻ trong các bài viết tiếp theo.

Tham khảo:

Leave a Reply

Your email address will not be published. Required fields are marked *