Định lý giới hạn trung tâm

Bách khoa toàn thư mở Wikipedia
Bước tới: menu, tìm kiếm

Trong xác suất, định lý giới hạn trung tâm là định lý nổi tiếng và có vai trò quan trọng. Nó là kết quả về sự hội tụ yếu của một dãy các biến ngẫu nhiên. Với định lý này, ta có kết quả là tổng của các biến ngẫu nhiên độc lập và phân phối đồng nhất theo cùng một phân phối xác suất, sẽ hội tụ về một biến ngẫu nhiên nào đó.

Trong trường hợp đơn giản nhất, được dùng dưới đây trong phần chứng minh của định lý, các biến ngẫu nhiên là độc lập, có cùng kỳ vọngphương sai. Một cách tổng quát, tổng của các biến ngẫu nhiên sẽ tăng vô định khi số biến ngẫu nhiên tăng. Do đó để có một kêt quả hữu hạn, ta hạn chế sự tăng của tổng bằng cách lấy tổng trừ đi giá trị trung bình và rút gọn bằng cách chia cho căn bậc hai của phương sai. Với một số các điều kiện nữa thì phân phối xác xuất của biến ngẫu nhiên giản lược sẽ hội tụ về một phân phối chuẩn.

Sự hội tụ được đảm bảo trong trường hợp đơn giản này. Tuy nhiên cũng tồn tại sự hội tụ trong trường hợp các biến ngẫu nhiên không cùng phân phối, nhưng vẫn phải đảm bảo điều kiện không có biến ngẫu nhiên nào có phân phối trội hơn hoặc gây ảnh hưởng đến phân phối của các biến ngẫu nhiên khác. Điều này được đảm bảo bởi điều kiện Lindebergđiều kiện Lyapunov. Một số phiên bản khác của định lý cũng cho phép sự phụ thuộc yếu giữa các biến ngẫu nhiên.

Ngoài ra còn có một số nghiên cứu khác của GnedenkoKolmogorov cho rằng tổng của các biến ngẫu nhiên với phân phối có đuôi giảm theo phân số 1/|x|α+1, 0 < α < 2 (do đó có phương sai vô hạn), sẽ hội tụ về phân phối Levy đối xứng và ổn định khi số biến nhẫu nhiên tăng.

Phần trình bày ở đây chỉ đề cập đến định lý giới hạn trung tâm cho trường hợp các phân phối có phương sai hữu hạn.

Định lý giới hạn trung tâm[sửa | sửa mã nguồn]

Cho X1, X2... là tập hợp các biến ngẫu nhiên được định nghĩa trên cùng một không gian xác suất, có cùng phân phối Dđộc lập lẫn nhau. Giả sử giá trị kỳ vọng  \mu độ lệch chuẩn  \sigma của phân phối D là tồn tại và hữu hạn (\sigma \neq 0).

Xét tổng Sn = X1 + ... + Xn. Ta có Sn có kỳ vọng là nμ và độ lệch chuẩn σ n½. Khi đó, phân phối của Sn hội tụ về phân phối chuẩn N(nμ,σ2n) khi n tiến về vô cùng.

Để làm rõ hơn sự hội tụ này, ta đăt:

Z_n = \frac{S_n - n \mu}{\sigma \sqrt{n}}.

để có được kỳ vọng và độ lệch chuẩn của Z_n lần lượt là 0 và 1.

Nếu phân phối của Zn hội tụ về phân phối chuẩn N(0,1) khi n tiến về vô cùng (tức là hội tụ theo phân phối), thì cũng có nghĩa là: nếu Φ là hàm phân phối tích lũy của N(0,1), thì với mọi số thực z:

\lim_{n \to \infty} \mbox{P}(Z_n \le z) = \Phi(z),

Hay một cách tương đương:

\lim_{n\to\infty}\mbox{P}\left(\frac{\overline{X}_n-\mu}{\sigma/\sqrt{n}}\leq z\right)=\Phi(z)

trong đó

\overline{X}_n=S_n/n=(X_1+\cdots+X_n)/n

Chứng minh định lý giới hạn trung tâm[sửa | sửa mã nguồn]

Mặc dù đây là định lý quan trọng trong thống kê và xác suất ứng dụng nhưng phần chứng minh của nó khá đơn giản bằng cách sử dụng các hàm đặc trưng, nó gần giống với phần chứng minh của luật số lớn.

Ta có với mọi i, Y_i=\frac{X_i-\mu}{\sigma} có kỳ vọng 0 và độ lệch chuẩn 1, với hàm đặc trưng được khai triển giới hạn dưới dạng:

\varphi_{Y_i}(t) = 1 - {t^2 \over 2} + o(t^2), \quad t \rightarrow 0.

Ta có:

Z_n = \frac{\overline{X}_n-\mu}{\sigma/\sqrt{n}} = \sum_{i=1}^n {Y_i \over \sqrt{n}}.

Từ các tính chất cơ bản của hàm đặc trưng, ta suy ra hàm đặc trưng của Zn

\varphi_{Z_n}\left(t\right) = \left[\varphi_{Y_i}\left({t \over \sqrt{n}}\right)\right]^n = \left[ 1 - {t^2 
\over 2n} + o\left({t^2 \over n}\right) \right]^n \, \rightarrow \, e^{-t^2/2} khi n \to +\infty.

Giới hạn này là hàm đặc trưng của phân phối chuẩn N(0,1). Từ đó định lý giới hạn trung tâm được chứng minh nhờ vào định lý về tính liên tục của Levy, trong đó có nói rằng, sự hội tụ của các hàm đặc trưng cho phép suy ra sự hội tụ theo phân phối.

Nếu moment bậc 3 E[(X - μ)3] tồn tại và hữu hạn, thì ta có hội tụ đều (uniform), và vận tốc hội tụ có bậc ít nhất là 1/n½ (xem định lý Berry-Esseen).

Trong các ứng dụng thực tế, định lý này cho phép thay thế tổng vô cùng lớn nhưng hữu hạn các biến ngẫu nhiên bằng một biến ngẫu nhiên có phân phối chuẩn, như vầy sẽ dễ dàng thao tác, tính toán hơn.

Các suy rộng từ định lý[sửa | sửa mã nguồn]

Hàm phân phối xác suất[sửa | sửa mã nguồn]

Hàm phân phối xác suất của tổng nhiều biến ngẫu nhiên độc lập được xác định bởi hàm xoắn (convolution) từ các hàm phân phối xác suất của các biến ngẫu nhiên đó. Từ định lý giới hạn trung tâm, ta có thể suy ra, hàm xoắn này hội tụ về một hàm phân phối xác suất chuẩn khi số biến ngẫu nhiên tăng vô hạn.

Tích các biến ngẫu nhiên[sửa | sửa mã nguồn]

Định lý giới hạn trung tâm phát biểu cho tổng các biến ngẫu nhiên độc lập, câu hỏi là chuyện gì xảy ra với tích của các biến ngẫu nhiên độc lập?

Ta biết rằng, logarit (log) của tích các số hạng thì bằng tổng logarit các số hạng. Định lý giới hạn trung tâm cho biết tổng logarit, và do đó logarit của tích, hội tụ về biến ngẫu nhiên phân phối chuẩn. Từ đó suy ra tích các biến ngẫu nhiên hội tụ về một biến ngẫu nhiên có phân phối chuẩn-logarit (log-normal).

Các định lý giới hạn trung tâm mở rộng[sửa | sửa mã nguồn]

Điều kiện Lyapunov[sửa | sửa mã nguồn]

Xét Xn là một dãy các biến ngẫu nhiên được định nghĩa trên cùng một không gian xác suất, không nhất thiết có cùng phân phối. Giả sử Xi có kỳ vọng hữu hạn μi và độ lệch chuẩn hữu hạn σi. Ta định nghĩa:

s_n^2 = \sum_{i = 1}^n \sigma_i^2.

Giả sử các moment bậc 3

r_i^3 = \mbox{E}\left({\left| X_i - \mu_i \right|}^3 \right)

là hữu hạn với mọi i

\lim_{n \to \infty} \frac{r_n}{s_n} = 0.

Các điều kiện trên được gọi la điều kiện Lyapunov.

Ta xét tổng mới Sn=X1+...+Xn. Kỳ vọng của Snmn = ∑i=1..nμi và độ lệch chuẩn là sn. Nếu ta chuẩn hóa Sn bằng cách đặt

Z_n = \frac{S_n - m_n}{s_n}

thì phân phối xác suất của Zn hội tụ về phân phối chuẩn N(0,1).

Điều kiện Lindeberg[sửa | sửa mã nguồn]

Với các giả thiết ban đầu như trong điều kiện Lyapunov.

Với mọi ε > 0


  \lim_{n \to \infty} \sum_{i = 1}^{n} \mbox{E}\left(
    \frac{(X_i - \mu_i)^2}{s_n^2}
    :
    \left| X_i - \mu_i \right| > \epsilon s_n
  \right) = 0

trong đó E(U: V > c) là kỳ vọng có điều kiện: kỳ vọng của U với điều kiện V > c. Khi đó phân phối xác suất của Zn hội tụ về phân phối chuẩn N(0,1).

Trường hợp các biến ngẫu nhiên không độc lập[sửa | sửa mã nguồn]

Có một số định lý nghiên cứu trường hợp tổng của các biến ngẫu nhiên không độc lập, ví dụ định lý giới han trung tâm m-phụ thuộc (m-dependent central limit theorem), định lý giới hạn trung tâm martingal (martingale central limit theorem) và định lý giới hạn trung tâm cho quá trình hỗn hợp (central limit theorem for mixing processes).

Links ngoài[sửa | sửa mã nguồn]