Mạng nơ-ron nhân tạo

Bách khoa toàn thư mở Wikipedia
Bước tới: menu, tìm kiếm
Một mạng nơ-ron là một nhóm các nút nối với nhau, gần giống như mạng khổng lồ các nơ-ron trong não người.

Mạng nơ-ron nhân tạo hay thường gọi ngắn gọn là mạng nơ-ron là một mô hình toán học hay mô hình tính toán được xây dựng dựa trên các mạng nơ-ron sinh học. Nó gồm có một nhóm các nơ-ron nhân tạo (nút) nối với nhau, và xử lý thông tin bằng cách truyền theo các kết nối và tính giá trị mới tại các nút (cách tiếp cận connectionism đối với tính toán). Trong nhiều trường hợp, mạng nơ-ron nhân tạo là một hệ thống thích ứng (adaptive system) tự thay đổi cấu trúc của mình dựa trên các thông tin bên ngoài hay bên trong chảy qua mạng trong quá trình học.

Trong thực tế sử dụng, nhiều mạng nơ-ron là các công cụ mô hình hóa dữ liệu thống kê phi tuyến. Chúng có thể được dùng để mô hình hóa các mối quan hệ phức tạp giữa dữ liệu vào và kết quả hoặc để tìm kiếm các dạng/mẫu trong dữ liệu.

[1] Để bắt đầu nghiên cứu về mạng nơ ron, bạn có thể dùng chương trình Spice-MLP (mạng nơ ron đa lớp - Multi Layer Neural Network) và Spice-SOM (mạng nơ ron tự tổ chức - Self Organizing Maps) có giải thích bằng tiếng Việt

Sử dụng mạng nơ-ron nhân tạo[sửa | sửa mã nguồn]

Có lẽ lợi thế lớn nhất của ANNs là khả năng được sử dụng như một cơ chế xấp xỉ hàm tùy ý mà 'học' được từ các dữ liệu quan sát. Tuy nhiên, sử dụng chúng không đơn giản như vậy, và một sự hiểu biết tương đối tốt về các lý thuyết cơ bản là điều cần thiết.

  • Chọn mô hình: điều này sẽ phụ thuộc vào cách trình bày dữ liệu và các ứng dụng. Mô hình quá phức tạp có xu hướng dẫn đến những thách thức trong việc học.
  • Thuật toán học: có rất nhiều sự thỏa thận giữa các thuật toán học. Hầu hết các thuật toán sẽ làm việc tốt với các siêu tham số (hyperparameter) đúng để huấn luyện trên một tập hợp dữ liệu cố định cụ thể. Tuy nhiên, việc lựa chọn và điều chỉnh một thuật toán để huấn luyện trên dữ liệu không nhìn thấy yêu cầu một số lượng đáng kể các thử nghiệm.
  • Mạnh mẽ: Nếu các mô hình, hàm chi phí và thuật toán học được lựa chọn một cách thích hợp, thì ANN sẽ cho kết quả có thể vô cùng mạnh mẽ.

Với việc thực hiện chính xác, ANN có thể được sử dụng một cách tự nhiên học trực tuyến và các ứng dụng tập dữ liệu lớn. Việc thực thi đơn giản của chúng và sự tồn tại của chủ yếu là địa phương phụ thuộc được thể hiện trong cấu trúc cho phép triển khai nhanh chóng, song song trong phần cứng.

Tham khảo[sửa | sửa mã nguồn]

Liên kết ngoài[sửa | sửa mã nguồn]