Hệ số tương quan
Bài viết này cần thêm chú thích nguồn gốc để kiểm chứng thông tin. |
Hệ số tương quan trong bài này nói về hệ số tương quan giữa hai biến số.
Trong lý thuyết xác suất và thống kê, hệ số tương quan cho biết độ mạnh của mối tương quan tuyến tính giữa hai biến số ngẫu nhiên.
Hệ số tương quan Pearson[sửa | sửa mã nguồn]
Có thể sử dụng nhiều công thức tính hệ số tương quan khác nhau cho những tình huống khác nhau. Hệ số tương quan được biết đến nhiều nhất là hệ số tương quan Pearson được tính bằng cách chia hiệp phương sai (covariance) của hai biến với tích độ lệch chuẩn (standard deviation) của chúng. Cách tính này được đưa ra trước tiên bởi Francis Galton.
Đặc trưng toán học[sửa | sửa mã nguồn]
Hệ số tương quan ρX, Y giữa hai biến ngẫu nhiên X và Y với kỳ vọng tương ứng là μX; μY và độ lệch chuẩn σX; σY được định nghĩa:
trong đó E là toán tử tính kỳ vọng và cov là hiệp phương sai. Một công thức khác cũng được sử dụng rộng rãi là
Vì μX = E(X), σX2 = E[(X - E(X))2] = E(X2) − E2(X) và tương tự đối với Y, và vì , nên ta có thể viết lại
Hệ số tương quan được định nghĩa như vậy chỉ đúng nếu các độ lệch chuẩn là có giới hạn và khác không. Một hệ luận tất yếu của bất phương trình Cauchy-Schwarz là trị tuyệt đối của hệ số tương quan không thể lớn hơn 1.
Hệ số tương quan bằng một trong trường hợp có tương quan tuyến tính đồng biến và -1 trong trường hợp tương quan tuyến tính nghịch biến. Các giá trị khác trong khoảng (-1,1) cho biết mức độ phụ thuộc tuyến tính giữa các biến. Hệ số tương quan càng gần với -1 và 1 thì tương quan giữa các biến càng mạnh.
Nếu các biến là độc lập thống kê thì hệ số tương quan bằng 0. Tuy nhiên, phát biểu ngược lại không đúng, vì hệ số tương quan chỉ phát hiện tương quan tuyến tính giữa hai biến.
Tham khảo[sửa | sửa mã nguồn]
Liên kết ngoài[sửa | sửa mã nguồn]
![]() |
Tra hệ số tương quan trong từ điển mở tiếng Việt Wiktionary |
- Earliest Uses: Correlation - gives basic history and references.
- Understanding Correlation - Introductory material by a U. of Hawaii Prof.
- Online Utility to Compute Correlation Coefficient (Scatter Diagram)
- Statsoft Electronic Textbook
- Pearson's Correlation Coefficient - How to calculate it quickly
- Learning by Simulations - The distribution of the correlation coefficient
- Correlation measures the strength of a linear relationship between two variables.
- MathWorld page on (cross-) correlation coefficient(s) of a sample.
- Compute Significance between two correlations - A useful website if one wants to compare two correlation values.
- A MATLAB Toolbox for computing Weighted Correlation Coefficients