Martingale Doob

Bách khoa toàn thư mở Wikipedia
Bước tới: menu, tìm kiếm

Một martingale Doob (còn gọi là martingale Levy) là một quá trình ngẫu nhiên tính giá trị của một biến ngẫu nhiên và có tính chất martingale theo một bộ lọc cho trước. Nó có thể được xem là giá trị xấp xỉ của một biến ngẫu nhiên dựa vào thông tin tích lũy được cho tới một thời điểm nhất định.

Định nghĩa[sửa | sửa mã nguồn]

Một martingale Doob (đặt theo tên của J. L. Doob)[cần dẫn nguồn] là một cách xây dựng martingale nói chung như sau. Ta xét một dãy các biến ngẫu nhiên

\vec{X}=X_1, X_2, ..., X_n

nhận giá trị trong tập A. Đối tượng quan tâm là một hàm f:A^n \to \Bbb{R}. Định nghĩa:

B_i=E_{X_{i+1},X_{i+2},...,X_{n}}[f(\vec{X})|X_{1},X_{2},...X_{i}]

trong đó giá trị kì vọng trên là một biến ngẫu nhiên do việc tính kì vọng chỉ dựa trên

X_{i+1},X_{i+2},...,X_{n},

X_{1},X_{2},...X_{i}

vẫn được xem là biến ngẫu nhiên. Có thể chứng minh rằng B_i là một martingale cho bất kì dãy X_i nào. Do đó nếu ta có thể chặn trên độ chênh lệch

|B_{i+1}-B_i|,

thì có thể áp dụng bất đẳng thức Azuma và kết luận với xác suất cao rằng f(\vec{X}) tập trung xung quanh giá trị kì vọng

E[f(\vec{X})]=B_0.

Bất đẳng thức McDiarmid[sửa | sửa mã nguồn]

Một phương pháp để chặn trên độ chênh lệch và áp dụng bất đẳng thức Azuma cho một martingale Doob là bất đẳng thức McDiarmid.[cần dẫn nguồn] Giả sử X_1, X_2, \dots, X_n là độc lập và giả sử f thỏa mãn

\sup_{x_1,x_2,\dots,x_n, \hat x_i} |f(x_1,x_2,\dots,x_n) - f(x_1,x_2,\dots,x_{i-1},\hat x_i, x_{i+1}, \dots, x_n)| 
\le c_i \qquad \text{khi} \quad 1 \le i \le n \; .

(Nói cách khác, việc thay đổi giá trị x_i của tọa độ thứ i làm thay đổi giá trị của f bởi một lượng không quá c_i.)

Do đó

|B_{i+1}-B_i| \le c_i

và theo bất đẳng thức Azuma, ta có bất đẳng thức McDiarmid cho mọi \varepsilon > 0:


\Pr \left\{ f(X_1, X_2, \dots, X_n) - E[f(X_1, X_2, \dots, X_n)] \ge \varepsilon \right\} 
\le 
\exp \left( - \frac{2 \varepsilon^2}{\sum_{i=1}^n c_i^2} \right)


\Pr \left\{ E[f(X_1, X_2, \dots, X_n)] - f(X_1, X_2, \dots, X_n) \ge \varepsilon \right\} 
\le 
\exp \left( - \frac{2 \varepsilon^2}{\sum_{i=1}^n c_i^2} \right)


\Pr \left\{ |E[f(X_1, X_2, \dots, X_n)] - f(X_1, X_2, \dots, X_n)| \ge \varepsilon \right\} 
\le 2 \exp \left( - \frac{2 \varepsilon^2}{\sum_{i=1}^n c_i^2} \right). \;

Xem thêm[sửa | sửa mã nguồn]

Tài liệu tham khảo[sửa | sửa mã nguồn]