Chuyển tới nội dung

Phân biệt AI – Machine learning – Deep learning

Trong lĩnh vực khoa học dữ liệu, ta thường thấy những thuật ngữ này được sử dụng trong những ngữ cảnh tương tự nhau và sử dụng cùng với nhau nên việc hiểu nhầm và đánh đồng chúng cũng dễ xảy ra hơn.
Chúng mình hi vọng bài viết này sẽ tạo ngữ cảnh, kích thích trí tò mò cho những bài viết sau về mảng ứng dụng tuyệt vời này của khoa học dữ liệu nha !

Artificial Intelligence

Trí tuệ nhân tạo (AI – Artificial Intelligence) chỉ chung về các loại công nghệ khiến cho máy móc có thể tự học hỏi, tự điều chỉnh và thực hiện các tác vụ tương tự như con người.

AI là lĩnh vực không mới và đã được chính thức công nhận vào năm 1956 nhưng mãi tới thời buổi hiện nay với khối lượng data khổng lồ từ Internet, IoT cũng như khả năng lưu trữ và xử lý dữ liệu mạnh mẽ, được hỗ trợ bởi các thuật toán nâng cao và những cải tiến đáng kể về sức mạnh xử lý và dung lượng lưu trữ của máy tính thì nó mới được áp dụng rộng rãi ở nhiều lĩnh vực.

Machine learning

Định nghĩa:

Trong khi AI chỉ chung những loại khoa học, công nghệ cho phép máy móc mô phỏng các năng lực tư duy của con người thì Machine learning – học máy lại là một nhánh của AI. Học máy nói về loại phương pháp mà ở đó máy móc cần trải qua quá trình “huấn luyện” và thích nghi chính nó bằng việc học từ dữ liệu có sẵn để thực hiện một tác vụ nào đó.

Kết quả mong muốn là máy móc có thể đưa ra những dự đoán khi có dữ liệu mới chưa từng được gặp qua được đưa vào.

Cơ chế của quá trình học:

Các thuật toán phải tiếp xúc với dữ liệu một cách liên tục, tự động lặp đi lặp lại quá trình đưa data vào trong hệ thống để tìm được các khuôn mẫu chung của dữ liệu và thích nghi với dữ liệu một cách độc lập.

Hệ thống sẽ học thông qua những tính toán từ rất nhiều dữ liệu trước đó để đưa ra những kết quả dự đoán đáng tin cậy cho những dữ liệu mới sau này với ít sự can thiệp từ con người.

Kết quả đạt được:

Kết quả tuyệt vời của quá trình này là khả năng đưa ra quyết định, đưa ra dự đoán mỗi khi có data mới được thêm vào, giúp máy móc tự thực hiện các tác vụ sao cho đạt được hiệu quả tối ưu nhất mặc dù không được lập trình cụ thể trước đó với rất ít sự can thiệp từ con người.

Nhờ những mô hình tự vận, tự học có khả năng thích nghi nhanh nhạy với dữ liệu thu thập được cùng tốc độ xử lý đáng kinh ngạc và độ chính xác đáng kể, các tổ chức có thể đưa ra quyết định tốt hơn, nhanh hơn mà không cần quá nhiều công sức từ con người.

Tại sao hiện nay ta mới được nghe nhiều hơn về Machine learning?

Để máy tính có thể tự học hỏi, cần xử lý một lượng lớn và đa dạng dữ liệu đủ để thuật toán có thể phát hiện những khuôn mẫu, xu hướng chung mà không cần phải được lập trình. Đây vốn là một tài nguyên không dễ để thu thập và xử lý ở thời điểm phát triển ban đầu của công nghệ học máy.

Khái niệm về thuật toán học máy cũng đã xuất hiện từ lâu nhưng mãi cho đến thời buổi hiện đại thì máy móc mới có khả năng tự động lặp đi lặp lại các thao tác tính toán phức tạp với số lượng phép tính lớn, tốc độ nhanh hơn rất nhiều lên lượng dữ liệu dồi dào từ big data.

Deep learning

Định nghĩa:

Deep learning là một nhánh nhỏ của Machine learning, nói về những thuật toán học máy phân tích và học từ data bằng cách mô phỏng lại cấu trúc tư duy logic và cách hoạt động của não bộ con người mỗi khi đưa ra một kết luận nào đó.

Deep learning sử dụng rất nhiều những đơn vị neuron có cấu trúc phân bố theo từng lớp (layered structured) và được gọi là artificial neural network (ANN) – dịch thô ra là mạng lưới thần kinh nhân tạo. Lấy cảm hứng từ hệ thần kinh não bộ con người, nó có khả năng xử lý những loại dữ liệu phi cấu trúc (unstructured data) mà học máy truyền thống rất khó có thể xử lý như là như nhận diện chữ viết,mặt người, giọng nói, phân biệt đối tượng thông qua hình ảnh, video…

Cấu trúc tổng quát của artificial neural network:

Đơn vị cơ bản nhất của một ANN được gọi là một neuron (nơron). Mỗi khi có xúc tác, các nơ ron cụ thể sẽ được kích hoạt và tín hiệu được truyền đi để tạo nên một hành động cụ thể.

Trong ANN, các neurons này là những biến chứa một giá trị bất kỳ gọi là giá trị kích hoạt. Số càng cao, mức kích hoạt càng mạnh. Các neurons này được sắp xếp theo từng “lớp” (layers).

Vậy giữa mỗi lớp các neuron được liên kết như thế nào ?

Mỗi một neuron trong rất nhiều neurons của một lớp bất kỳ sẽ liên kết với tất cả các neurons của lớp trước đó. Tưởng tượng mỗi một mối liên kết này là một sợi dây mang một giá trị cụ thể biểu thị cho độ mạnh của nó. Giá trị càng cao thì mối liên kết càng mạnh mẽ. Mối liên kết mạnh nghĩa là mỗi khi một neuron được kích hoạt, neuron liên kết với nó ở lớp tiếp theo qua đường dây mạnh cũng sẽ có giá trị kích hoạt cao.

Giống như trong hệ thần kinh sinh học, những chuỗi hành động nào liên quan mật thiết và thường xảy ra cùng nhau thì đường liên kết giữa các neuron điều khiển những hoạt động trong chuỗi này trở nên ngày càng mạnh mẽ.

Có 3 loại lớp neuron:

Input layer: Lớp neuron trực tiếp nhận giá trị từ dữ liệu bên ngoài vào. Đó có thể là âm thanh, hình ảnh… Thường thi khi đưa các giá trị vào lớp này thì người ta sẽ có cách để biểu diễn nó thành số liệu (lượng hóa). Thông tin này được sử dụng để tính giá trị kích hoạt (activation value) của từng neuron trong lớp này. Các bạn có thể xem ví dụ cho việc này ở ảnh sau.

Hidden layers: Một hoặc nhiều lớp neuron có nhiệm vụ tiếp nhận giá trị kích hoạt từ các neuron ở input layer. Dựa vào độ mạnh của mối liên kết với neuron input và giá trị kích hoạt của từng neuron input mà các lớp trong hidden layers sẽ cho ra giá trị kích hoạt riêng của từng neuron trong nó. Tương tự, các giá trị kích hoạt sẽ được chuyển sang lớp tiếp theo cho đến lớp cuối cùng.

Output layer: Là lớp neuron dùng để đưa ra kết luận có ý nghĩa và hiểu được bởi con người sau khi dữ liệu được xử lý qua các lớp trước, được liên kết trực tiếp với lớp cuối của hidden layers.

—Hết—

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *