Học không có giám sát

Bách khoa toàn thư mở Wikipedia
Bước tới: menu, tìm kiếm

Học không có giám sát (tiếng Anh là unsupervised learning) là một phương pháp của ngành học máy nhằm tìm ra một mô hình mà phù hợp với các quan sát. Nó khác biệt với học có giám sát ở chỗ là đầu ra đúng tương ứng cho mỗi đầu vào là không biết trước. Trong học không có giám sát, một tập dữ liệu đầu vào được thu thập. Học không có giám sát thường đối xử với các đối tượng đầu vào như là một tập các biến ngẫu nhiên. Sau đó, một mô hình mật độ kết hợp sẽ được xây dựng cho tập dữ liệu đó.

Học không có giám sát có thể được dùng kết hợp với suy diễn Bayes (Bayesian inference) để cho ra xác suất có điều kiện (nghĩa là học có giám sát) cho bất kì biến ngẫu nhiên nào khi biết trước các biến khác.

Học không có giám sát cũng hữu ích cho việc nén dữ liệu: về cơ bản, mọi giải thuật nén dữ liệu hoặc là dựa vào một phân bố xác suất trên một tập đầu vào một cách tường minh hay không tường minh.

Một dạng khác của học không có giám sát là phân mảnh (data clustering), nó đôi khi không mang tính xác suất. Xem thêm phân tích khái niệm hình thức (formal concept analysis).

Tham khảo[sửa | sửa mã nguồn]

Xem thêm[sửa | sửa mã nguồn]

Phân mảnh dữ liệu (Data clustering),

Self-organizing map,

Giải thuật EM (Expectation-maximization algorithm)