Bỏ qua để đến Nội dung

Mạng nơ-ron là gì?

Mạng nơ-ron là một phương pháp trong trí tuệ nhân tạo (AI) dạy máy tính xử lý dữ liệu theo cách lấy cảm hứng từ bộ não con người. Đây là một loại quy trình học máy (ML) , được gọi là học sâu , sử dụng các nút hoặc nơ-ron được kết nối với nhau trong một cấu trúc phân lớp giống với bộ não con người. Nó tạo ra một hệ thống thích ứng mà máy tính sử dụng để học hỏi từ những sai lầm của chúng và liên tục cải thiện. Do đó, mạng nơ-ron nhân tạo cố gắng giải quyết các vấn đề phức tạp, như tóm tắt tài liệu hoặc nhận dạng khuôn mặt, với độ chính xác cao hơn.

Mạng nơ-ron là gì?

Mạng nơ-ron là một phương pháp trong trí tuệ nhân tạo (AI) dạy máy tính xử lý dữ liệu theo cách lấy cảm hứng từ bộ não con người. Đây là một loại quy trình học máy (ML) , được gọi là học sâu , sử dụng các nút hoặc nơ-ron được kết nối với nhau trong một cấu trúc phân lớp giống với bộ não con người. Nó tạo ra một hệ thống thích ứng mà máy tính sử dụng để học hỏi từ những sai lầm của chúng và liên tục cải thiện. Do đó, mạng nơ-ron nhân tạo cố gắng giải quyết các vấn đề phức tạp, như tóm tắt tài liệu hoặc nhận dạng khuôn mặt, với độ chính xác cao hơn.

Tại sao mạng nơ-ron lại quan trọng?

Mạng nơ-ron có thể giúp máy tính đưa ra quyết định thông minh với sự hỗ trợ hạn chế của con người. Điều này là do chúng có thể học và mô hình hóa mối quan hệ giữa dữ liệu đầu vào và đầu ra phi tuyến tính và phức tạp. Ví dụ, chúng có thể thực hiện các tác vụ sau.

Đưa ra những khái quát và suy luận

Mạng nơ-ron có thể hiểu dữ liệu phi cấu trúc và đưa ra những quan sát chung mà không cần đào tạo rõ ràng. Ví dụ, chúng có thể nhận ra rằng hai câu đầu vào khác nhau có ý nghĩa tương tự nhau:

  • Bạn có thể cho tôi biết cách thanh toán không?
  • Tôi có thể chuyển tiền bằng cách nào?

Một mạng nơ-ron sẽ biết rằng cả hai câu đều có nghĩa giống nhau. Hoặc nó có thể nhận ra rộng rãi rằng Baxter Road là một địa điểm, nhưng Baxter Smith là tên của một người.

Mạng nơ-ron được sử dụng để làm gì?

Mạng nơ-ron có nhiều trường hợp sử dụng trong nhiều ngành công nghiệp, chẳng hạn như sau:

  • Chẩn đoán y khoa bằng phân loại hình ảnh y khoa
  • Tiếp thị mục tiêu bằng cách lọc mạng xã hội và phân tích dữ liệu hành vi
  • Dự đoán tài chính bằng cách xử lý dữ liệu lịch sử của các công cụ tài chính
  • Dự báo nhu cầu điện và năng lượng
  • Quy trình và kiểm soát chất lượng
  • Nhận dạng hợp chất hóa học

Chúng tôi đưa ra bốn ứng dụng quan trọng của mạng nơ-ron dưới đây.

Tầm nhìn máy tính

Thị giác máy tính là khả năng của máy tính để trích xuất thông tin và hiểu biết sâu sắc từ hình ảnh và video. Với mạng lưới nơ-ron, máy tính có thể phân biệt và nhận dạng hình ảnh tương tự như con người. Thị giác máy tính có một số ứng dụng, chẳng hạn như sau:

  • Nhận dạng hình ảnh trong xe tự lái để chúng có thể nhận ra các biển báo đường bộ và những người tham gia giao thông khác
  • Kiểm duyệt nội dung để tự động xóa nội dung không an toàn hoặc không phù hợp khỏi kho lưu trữ hình ảnh và video
  • Nhận dạng khuôn mặt để xác định khuôn mặt và nhận dạng các thuộc tính như mắt mở, kính và râu trên khuôn mặt
  • Nhãn hình ảnh để xác định logo thương hiệu, quần áo, thiết bị an toàn và các chi tiết hình ảnh khác

Nhận dạng giọng nói

Mạng nơ-ron có thể phân tích giọng nói của con người bất chấp các mẫu giọng nói, cao độ, giọng điệu, ngôn ngữ và giọng nói khác nhau. Các trợ lý ảo như Amazon Alexa và phần mềm phiên âm tự động sử dụng nhận dạng giọng nói để thực hiện các tác vụ như sau:

  • Hỗ trợ tổng đài viên và tự động phân loại cuộc gọi
  • Chuyển đổi các cuộc trò chuyện lâm sàng thành tài liệu theo thời gian thực
  • Phụ đề chính xác cho video và bản ghi cuộc họp để có phạm vi tiếp cận nội dung rộng hơn

Xử lý ngôn ngữ tự nhiên

Xử lý ngôn ngữ tự nhiên (NLP) là khả năng xử lý văn bản tự nhiên do con người tạo ra. Mạng nơ-ron giúp máy tính thu thập thông tin chi tiết và ý nghĩa từ dữ liệu văn bản và tài liệu. NLP có một số trường hợp sử dụng, bao gồm trong các chức năng sau:

  • Các tác nhân ảo và chatbot tự động
  • Tự động tổ chức và phân loại dữ liệu đã viết
  • Phân tích thông tin kinh doanh của các tài liệu dài như email và biểu mẫu
  • Lập chỉ mục các cụm từ khóa biểu thị tình cảm, như các bình luận tích cực và tiêu cực trên mạng xã hội
  • Tóm tắt tài liệu và tạo bài viết cho một chủ đề nhất định

Công cụ đề xuất

Mạng nơ-ron có thể theo dõi hoạt động của người dùng để phát triển các đề xuất được cá nhân hóa. Chúng cũng có thể phân tích mọi hành vi của người dùng và khám phá các sản phẩm hoặc dịch vụ mới mà một người dùng cụ thể quan tâm. Ví dụ, Curalate, một công ty khởi nghiệp có trụ sở tại Philadelphia, giúp các thương hiệu chuyển đổi các bài đăng trên mạng xã hội thành doanh số. Các thương hiệu sử dụng dịch vụ gắn thẻ sản phẩm thông minh (IPT) của Curalate để tự động thu thập và quản lý nội dung xã hội do người dùng tạo. IPT sử dụng mạng nơ-ron để tự động tìm và đề xuất các sản phẩm có liên quan đến hoạt động truyền thông xã hội của người dùng. Người tiêu dùng không phải tìm kiếm trong các danh mục trực tuyến để tìm một sản phẩm cụ thể từ hình ảnh truyền thông xã hội. Thay vào đó, họ có thể sử dụng tính năng gắn thẻ sản phẩm tự động của Curalate để mua sản phẩm một cách dễ dàng.

Mạng lưới nơ-ron hoạt động như thế nào?

Bộ não con người là nguồn cảm hứng đằng sau kiến ​​trúc mạng nơ-ron. Các tế bào não người, được gọi là nơ-ron, tạo thành một mạng lưới phức tạp, có sự kết nối chặt chẽ và gửi tín hiệu điện cho nhau để giúp con người xử lý thông tin. Tương tự như vậy, một mạng nơ-ron nhân tạo được tạo thành từ các nơ-ron nhân tạo hoạt động cùng nhau để giải quyết một vấn đề. Nơ-ron nhân tạo là các mô-đun phần mềm, được gọi là các nút, và mạng nơ-ron nhân tạo là các chương trình phần mềm hoặc thuật toán, về bản chất, sử dụng các hệ thống máy tính để giải các phép tính toán học.

Kiến trúc mạng nơ-ron đơn giản

Một mạng nơ-ron cơ bản có các nơ-ron nhân tạo được kết nối với nhau theo ba lớp:

Lớp đầu vào

Thông tin từ thế giới bên ngoài đi vào mạng nơ-ron nhân tạo từ lớp đầu vào. Các nút đầu vào xử lý dữ liệu, phân tích hoặc phân loại dữ liệu và chuyển dữ liệu đến lớp tiếp theo.

Lớp ẩn

Các lớp ẩn lấy đầu vào từ lớp đầu vào hoặc các lớp ẩn khác. Mạng nơ-ron nhân tạo có thể có nhiều lớp ẩn. Mỗi lớp ẩn phân tích đầu ra từ lớp trước, xử lý thêm và chuyển đến lớp tiếp theo.

Lớp đầu ra

Lớp đầu ra đưa ra kết quả cuối cùng của tất cả quá trình xử lý dữ liệu của mạng nơ-ron nhân tạo. Nó có thể có một hoặc nhiều nút. Ví dụ, nếu chúng ta có bài toán phân loại nhị phân (có/không), lớp đầu ra sẽ có một nút đầu ra, sẽ đưa ra kết quả là 1 hoặc 0. Tuy nhiên, nếu chúng ta có bài toán phân loại nhiều lớp, lớp đầu ra có thể bao gồm nhiều hơn một nút đầu ra.

Kiến trúc mạng nơ-ron sâu

Mạng nơ-ron sâu, hay mạng học sâu, có một số lớp ẩn với hàng triệu nơ-ron nhân tạo được liên kết với nhau. Một con số, được gọi là trọng số, biểu thị các kết nối giữa một nút và một nút khác. Trọng số là một số dương nếu một nút kích thích một nút khác hoặc là số âm nếu một nút này ngăn chặn nút kia. Các nút có giá trị trọng số cao hơn có nhiều ảnh hưởng hơn đến các nút khác.

Về mặt lý thuyết, mạng nơ-ron sâu có thể ánh xạ bất kỳ loại đầu vào nào thành bất kỳ loại đầu ra nào. Tuy nhiên, chúng cũng cần nhiều đào tạo hơn so với các phương pháp học máy khác. Chúng cần hàng triệu ví dụ về dữ liệu đào tạo thay vì có lẽ hàng trăm hoặc hàng nghìn ví dụ mà một mạng đơn giản hơn có thể cần.

Có những loại mạng nơ-ron nào?

Mạng nơ-ron nhân tạo có thể được phân loại theo cách dữ liệu chảy từ nút đầu vào đến nút đầu ra. Dưới đây là một số ví dụ:

Mạng nơ-ron truyền thẳng

Mạng nơ-ron truyền thẳng xử lý dữ liệu theo một hướng, từ nút đầu vào đến nút đầu ra. Mỗi nút trong một lớp được kết nối với mọi nút trong lớp tiếp theo. Mạng truyền thẳng sử dụng quy trình phản hồi để cải thiện dự đoán theo thời gian.

Thuật toán lan truyền ngược

Mạng nơ-ron nhân tạo học liên tục bằng cách sử dụng vòng phản hồi hiệu chỉnh để cải thiện phân tích dự đoán của chúng. Nói một cách đơn giản, bạn có thể nghĩ về dữ liệu chảy từ nút đầu vào đến nút đầu ra thông qua nhiều đường dẫn khác nhau trong mạng nơ-ron. Chỉ có một đường dẫn là đường dẫn đúng, ánh xạ nút đầu vào đến nút đầu ra đúng. Để tìm đường dẫn này, mạng nơ-ron sử dụng vòng phản hồi, hoạt động như sau:

  1. Mỗi nút sẽ đoán về nút tiếp theo trên đường dẫn.
  2. Nó kiểm tra xem dự đoán có đúng không. Các nút gán giá trị trọng số cao hơn cho các đường dẫn dẫn đến nhiều dự đoán đúng hơn và gán giá trị trọng số thấp hơn cho các đường dẫn nút dẫn đến dự đoán không đúng.
  3. Đối với điểm dữ liệu tiếp theo, các nút sẽ đưa ra dự đoán mới bằng cách sử dụng đường dẫn có trọng số cao hơn, sau đó lặp lại Bước 1.

Mạng nơ-ron tích chập

Các lớp ẩn trong mạng nơ-ron tích chập thực hiện các chức năng toán học cụ thể, như tóm tắt hoặc lọc, được gọi là tích chập. Chúng rất hữu ích cho phân loại hình ảnh vì chúng có thể trích xuất các đặc điểm có liên quan từ hình ảnh hữu ích cho việc nhận dạng và phân loại hình ảnh. Dạng mới dễ xử lý hơn mà không làm mất các đặc điểm quan trọng để đưa ra dự đoán tốt. Mỗi lớp ẩn trích xuất và xử lý các đặc điểm hình ảnh khác nhau, như các cạnh, màu sắc và độ sâu.

Làm thế nào để đào tạo mạng lưới nơ-ron?

Đào tạo mạng nơ-ron là quá trình dạy mạng nơ-ron thực hiện một nhiệm vụ. Mạng nơ-ron học bằng cách ban đầu xử lý một số tập dữ liệu lớn được gắn nhãn hoặc không được gắn nhãn. Bằng cách sử dụng các ví dụ này, sau đó chúng có thể xử lý các đầu vào không xác định chính xác hơn.

Học có giám sát

Trong học có giám sát, các nhà khoa học dữ liệu cung cấp các tập dữ liệu được gắn nhãn cho mạng nơ-ron nhân tạo cung cấp câu trả lời đúng trước. Ví dụ, một mạng học sâu đào tạo về nhận dạng khuôn mặt ban đầu xử lý hàng trăm nghìn hình ảnh khuôn mặt người, với nhiều thuật ngữ khác nhau liên quan đến nguồn gốc dân tộc, quốc gia hoặc cảm xúc mô tả từng hình ảnh.

Mạng nơ-ron từ từ xây dựng kiến ​​thức từ các tập dữ liệu này, cung cấp câu trả lời đúng trước. Sau khi mạng được đào tạo, nó bắt đầu đưa ra dự đoán về nguồn gốc dân tộc hoặc cảm xúc của một hình ảnh mới về khuôn mặt người mà nó chưa từng xử lý trước đó.

Học sâu trong bối cảnh mạng nơ-ron là gì?

Trí tuệ nhân tạo là lĩnh vực khoa học máy tính nghiên cứu các phương pháp cung cấp cho máy móc khả năng thực hiện các nhiệm vụ đòi hỏi trí thông minh của con người. Học máy là một kỹ thuật trí tuệ nhân tạo cho phép máy tính truy cập vào các tập dữ liệu rất lớn và dạy chúng cách học từ dữ liệu này. Phần mềm học máy tìm ra các mẫu trong dữ liệu hiện có và áp dụng các mẫu đó vào dữ liệu mới để đưa ra các quyết định thông minh. Học sâu là một tập hợp con của học máy sử dụng các mạng học sâu để xử lý dữ liệu.

Học máy so với học sâu

Các phương pháp học máy truyền thống đòi hỏi đầu vào của con người để phần mềm học máy hoạt động đủ tốt. Một nhà khoa học dữ liệu xác định thủ công tập hợp các tính năng có liên quan mà phần mềm phải phân tích. Điều này hạn chế khả năng của phần mềm, khiến việc tạo và quản lý trở nên tẻ nhạt.

Mặt khác, trong học sâu, nhà khoa học dữ liệu chỉ cung cấp dữ liệu thô cho phần mềm. Mạng học sâu tự suy ra các tính năng và học độc lập hơn. Nó có thể phân tích các tập dữ liệu phi cấu trúc như tài liệu văn bản, xác định thuộc tính dữ liệu nào cần ưu tiên và giải quyết các vấn đề phức tạp hơn.

Ví dụ, nếu bạn đang đào tạo phần mềm máy học để nhận dạng chính xác hình ảnh thú cưng, bạn sẽ cần thực hiện các bước sau:

  • Tìm và dán nhãn hàng nghìn hình ảnh thú cưng như mèo, chó, ngựa, chuột đồng, vẹt, v.v. theo cách thủ công.
  • Cho phần mềm học máy biết những đặc điểm nào cần tìm để có thể xác định hình ảnh bằng cách loại trừ. Ví dụ, nó có thể đếm số chân, sau đó kiểm tra hình dạng mắt, hình dạng tai, đuôi, lông, v.v.
  • Đánh giá và thay đổi thủ công các tập dữ liệu được gắn nhãn để cải thiện độ chính xác của phần mềm. Ví dụ, nếu tập huấn luyện của bạn có quá nhiều hình ảnh mèo đen, phần mềm sẽ xác định đúng mèo đen nhưng không xác định đúng mèo trắng.
  • Tuy nhiên, trong học sâu, mạng nơ-ron sẽ xử lý tất cả hình ảnh và tự động xác định rằng chúng cần phân tích số lượng chân và hình dạng khuôn mặt trước, sau đó mới xem xét đuôi để xác định chính xác con vật trong ảnh.

trong AI