Phân nhóm dữ liệu

Bách khoa toàn thư mở Wikipedia
Bước tới: menu, tìm kiếm

Phân nhóm dữ liệu (tiếng Anh: clustering) là một trong những kỹ thuật khai phá dữ liệu. Phân nhóm được áp dụng rộng rãi trong nhiều lĩnh vực khác nhau như khoa học máy tính (xử lý ảnh), nghiên cứu thị trường (phân tích nhóm thị trường khách hàng), địa chất (phân tích bề mặt Trái Đất), v.v. Phân nhóm là cách nhóm các đối tượng thành các nhóm sao cho các đối tượng trong cùng một nhóm gần nhau hơn và các đối tượng của hai nhóm khác nhau khác nhau rất nhiều.