Phân phối chuẩn nhiều chiều

Bách khoa toàn thư mở Wikipedia
Bước tới: menu, tìm kiếm
Phân phối chuẩn nhiều chiều
Hàm mật độ xác suất
Hàm phân phối tích lũy
Tham số \mu = [\mu_1, \dots, \mu_N]^T vị trí (véc tơ giá trị thực)
\Sigma ma trận hiệp phương sai (ma trận xác định dương giá trị thực kích thước N\times N)
Giá x \in\mathbb{R}^N\!
Hàm mật độ xác suất f_X(x_1, \dots, x_N)=\frac {1} {(2\pi)^{N/2} \left|\Sigma\right|^{1/2}}

                 \exp\left(-\frac{1}{2}(x - \mu)^\top \Sigma^{-1} (x - \mu)\right)
Hàm phân phối tích lũy
Giá trị kỳ vọng \mu
Trung vị \mu
Mode \mu
Phương sai \Sigma (ma trận hiệp phương sai)
Độ xiên 0
Độ nhọn 0
Entropy \ln\left(\sqrt{(2\,\pi\,e)^N \left| \Sigma \right|}\right)\!
Hàm sinh moment M_X(t)= \exp\left(\mu^\top t + \frac{1}{2} t^\top \Sigma t\right)
Hàm đặc trưng \phi_X(t;\mu,\Sigma)=\exp\left(i \mu^\top t - \frac{1}{2} t^\top \Sigma t\right)


Trong lý thuyết xác suấtthống kê, phân phối chuẩn nhiều chiều, đôi khi được gọi là phân phối Gauss nhiều chiều, là tổng quát hóa của phân phối chuẩn một chiều (còn gọi là phân phối Gauss) cho không gian nhiều chiều hơn. Phân phối này còn có quan hệ gần gũi với phân phối chuẩn ma trận.

Trường hợp tổng quát[sửa | sửa mã nguồn]

Một véc tơ ngẫu nhiên \ X = [X_1, \dots, X_N]^T tuân theo một phân phối chuẩn nhiều chiều nếu nó thỏa mãn các điều kiện tương đương nhau sau đây:

  • tồn tại một véc tơ ngẫu nhiên \ Z = [Z_1, \dots, Z_M]^T, trong đó các thành phần của nó là các biến ngẫu nhiên độc lập tuân theo phân phối chuẩn chuẩn hóa, một véc tơ \ \mu = [\mu_1, \dots, \mu_N]^T và một ma trận \ A kích thước N \times M sao cho \ X = A Z + \mu.

\phi_X\left(u;\mu,\Sigma\right)
=
\exp
\left(
 i \mu^\top u - \frac{1}{2} u^\top \Sigma u
\right).

Nếu \ \Sigmama trận không suy biến, thì phân phối này có thể được mô tả bởi hàm mật độ xác suất sau:


f_X(x_1, \dots, x_N)
=
\frac
 {1}
 {(2\pi)^{N/2}|\Sigma|^{1/2}}
\exp
\left(
 -\frac{1}{2}
 (x - \mu)^\top \Sigma^{-1} (x - \mu)
\right)

trong đó \ \left| \Sigma \right|định thức của \ \Sigma. Lưu ý rằng phương trình trên suy biến về phương trình của phân phối chuẩn một chiều nếu \ \Sigma là một giá trị vô hướng (nghĩa là một ma trận 1x1).

Véc tơ μ trong các điều kiện trên là giá trị kỳ vọng của X và ma trận \ \Sigma = A A^T là ma trận hiệp phương sai của thành phần Xi.

Cần lưu ý rằng ma trận hiệp phương sai có thể suy biến (và khi đó không được mô tả bởi các công thức sử dụng \ \Sigma^{-1} ở trên).

Trường hợp này thường xảy ra trong thống kê; ví dụ, trong phân phối của véc tơ trong các bài toán hồi quy tuyến tính thông thường. Cũng lưu ý rằng các Xi nói chung là không độc lập; chúng có thể được xem là kết quả của việc áp dụng biến đổi tuyến tính A cho tập hợp Z gồm các biến ngẫu nhiên Gauss độc lập.

Việc phân phối của một véc tơ ngẫu nhiên X là một phân phối chuẩn nhiều chiều được ký hiệu bởi công thức sau:

X\ \sim \mathcal{N}(\mu, \Sigma),

hoặc viết tường minh rằng X biến trong không gian N-chiều,

X\ \sim \mathcal{N}_N(\mu, \Sigma).

Hàm phân phối tích lũy[sửa | sửa mã nguồn]

Hàm phân phối tích lũy (cdf) F(x) được định nghĩa là xác suất mà mỗi giá trị trong một véc tơ ngẫu nhiên X đều nhỏ hơn hay bằng giá trị tương ứng trong véc tơ x. Tuy không có dạng đóng cho F(x), có một số thuật toán ước tính giá trị của nó. Ví dụ, xem MVNDST tại [1] (dùng FORTRAN) hay [2] (dùng MATLAB).

Một phản ví dụ[sửa | sửa mã nguồn]

Điều kiện rằng hai biến ngẫu nhiên XY đều có phân phối chuẩn không kéo theo việc cặp (XY) có một phân phối chuẩn có điều kiện phụ thuộc (joint normal distribution). Một ví dụ đơn giản là: Y = X nếu |X| > 1 và Y = −X nếu |X| < 1. Điều này cũng đúng cho số biến ngẫu nhiên nhiều hơn 2.

Độc lập và phân phối chuẩn[sửa | sửa mã nguồn]

Nếu XY có phân phối chuẩn và độc lập thống kê, thì chúng có một phân phối chuẩn có điều kiện phụ thuộc, nghĩa là cặp (XY) phải có phân phối chuẩn 2 chiều. Tuy nhiên, một cặp biến ngẫu nhiên có phân phối chuẩn có điều kiện phụ thuộc không nhất thiết độc lập lẫn nhau.

Trường hợp 2 chiều[sửa | sửa mã nguồn]

Trong trường hợp 2 chiều không suy biến, hàm mật độ xác suất (với kì vọng (0,0)) là


f(x,y)
=
\frac{1}{2 \pi \sigma_x \sigma_y \sqrt{1-\rho^2}}
\exp
\left(
 -\frac{1}{2 (1-\rho^2)}
 \left(
  \frac{x^2}{\sigma_x^2} +
  \frac{y^2}{\sigma_y^2} -
  \frac{2 \rho x y}{ (\sigma_x \sigma_y)}
 \right)
\right)

trong đó \rhotương quan giữa XY. Khi đó,


\Sigma =
\begin{bmatrix}
\sigma_x^2              & \rho \sigma_x \sigma_y \\
\rho \sigma_x \sigma_y  & \sigma_y^2
\end{bmatrix}
.

Biến đổi afin[sửa | sửa mã nguồn]

Nếu Y = c + B X \, là một biến đổi afin của X\ \sim \mathcal{N}(\mu, \Sigma), trong đó c\, là một véc tơ M \times 1 gồm các hằng số và B\, là ma trận M \times N, thì Y\, có phân phối chuẩn nhiều chiều với giá trị kỳ vọng c + B \mu \, và phương sai B \Sigma B^T \, nghĩa là, Y \sim \mathcal{N} \left(c + B \mu, B \Sigma B^T\right). Đặc biệt, tập con bất kỳ của X_i\, đều có một phân phối biên duyên là phân phối chuẩn nhiều chiều. Để minh họa, ta xét ví dụ sau: để tách tập con (X_1, X_2, X_4)^T \,, sử dụng


B
=
\begin{bmatrix}
 1 & 0 & 0 & 0 & 0 & \ldots & 0 \\
 0 & 1 & 0 & 0 & 0 & \ldots & 0 \\
 0 & 0 & 0 & 1 & 0 & \ldots & 0
\end{bmatrix}

ma trận này trích lấy các phần tử mong muốn.

Một hệ quả khác là phân phối của Z=b\cdot X, trong đó b là một véc tơ có cùng số chiều với X và dấu chấm ký hiệu phép nhân véc tơ, là phân phối chuẩn một chiều với Z\sim\mathcal{N}\left(b\cdot\mu, b^T\Sigma b\right). Kết quả đó thu được bằng cách sử dụng


B=\begin{bmatrix}
b_1 & b_2 & \ldots & b_n\\
0   & 0   & \ldots & 0  \\
    &     & \vdots &    \\
0   & 0   & \ldots & 0  \\
\end{bmatrix}

và chỉ xét thành phần đầu tiên của tích (hàng đầu của B là véc tơ b). Để ý tính chất xác định dương của \Sigma hàm ý rằng phương sai của tích vô hướng phải là số dương.

Tham khảo[sửa | sửa mã nguồn]