Phân tích cụm
Phân tích cụm (hay phân nhóm, gom cụm, tiếng Anh: cluster analysis) là một tác vụ gom nhóm một tập các đối tượng theo cách các đối tượng cùng nhóm (gọi là cụm, cluster) sẽ có tính giống nhau (theo các đặc tính nào đó) hơn so với các đối tượng ngoài nhóm hoặc thuộc các nhóm khác.[1][2] Phân tích cụm là một tác vụ chính của khai phá dữ liệu, và là một kỹ thuật phổ biến trong thống kê phân tích dữ liệu, được dùng trong nhiều lĩnh vực, bao gồm nhận dạng mẫu, phân tích ảnh, truy hồi thông tin, tin sinh học, nén dữ liệu, đồ họa máy tính và học máy.
Phân tích cụm có nguồn gốc ở lĩnh vực nhân chủng học do Driver và Kroeber đề xuất năm 1932[3] và giới thiệu trong tâm lý học bởi Joseph Zubin năm 1938[4] và Robert Tryon năm 1939[5] cũng như được dùng khá nổi tiếng bởi Raymond Cattell bắt đầu từ năm 1943[6] để phân loại lý thuyết tính trạng trong lĩnh vực tâm lý học nhân cách.
Xem thêm
[sửa | sửa mã nguồn]Các dạng phân tích cụm chuyên biệt
[sửa | sửa mã nguồn]- Automatic clustering algorithms
- Balanced clustering
- Clustering high-dimensional data
- Conceptual clustering
- Consensus clustering
- Constrained clustering
- Community structure
- Data stream clustering
- HCS clustering algorithm
- Sequence clustering
- Phân vùng quang phổ
Các kỹ thuật được dùng trong phân tích cụm
[sửa | sửa mã nguồn]- Mạng thần kinh nhân tạo (ANN)
- Nearest neighbor search
- Neighbourhood components analysis
- Latent class model
- Affinity propagation
Tiền xử lý và tham chiếu dữ liệu
[sửa | sửa mã nguồn]Khác
[sửa | sửa mã nguồn]- Cluster-weighted modeling
- Curse of dimensionality
- Determining the number of clusters in a data set
- Parallel coordinates
- Phân tích cấu trúc dữ liệu (thống kê)
Tham khảo
[sửa | sửa mã nguồn]- ^ What is the Cluster Analysis?, DeepAI.
- ^ cluster analysis, Merriam Webster.
- ^ Driver and Kroeber (1932). “Quantitative Expression of Cultural Relationships”. University of California Publications in American Archaeology and Ethnology. Quantitative Expression of Cultural Relationships: 211–256. Bản gốc lưu trữ ngày 6 tháng 12 năm 2020. Truy cập ngày 19 tháng 11 năm 2020 – qua http://dpg.lib.berkeley.edu.
- ^ Zubin, Joseph (1938). “A technique for measuring like-mindedness”. The Journal of Abnormal and Social Psychology (bằng tiếng Anh). 33 (4): 508–516. doi:10.1037/h0055441. ISSN 0096-851X.
- ^ Tryon, Robert C. (1939). Cluster Analysis: Correlation Profile and Orthometric (factor) Analysis for the Isolation of Unities in Mind and Personality. Edwards Brothers.
- ^ Cattell, R. B. (1943). “The description of personality: Basic traits resolved into clusters”. Journal of Abnormal and Social Psychology. 38 (4): 476–506. doi:10.1037/h0054116.