Khác biệt giữa bản sửa đổi của “Hợp lý cực đại”

Bách khoa toàn thư mở Wikipedia
Nội dung được xóa Nội dung được thêm vào
Tạo bài mới
 
nKhông có tóm lược sửa đổi
Dòng 15: Dòng 15:
MLE dựa trên giả thiết rằng các mẫu dữ liệu <math>D=\{X_{1},..,X_{N}\}</math> có được đều [[độc lập và có cùng phân bố]] (i.i.d), với hàm phân bố thuộc một lớp cụ thể (ví dụ như Gaussian hoặc luỹ thừa) với tham số <math>\theta</math> chưa biết. Mục tiêu của MLE, như các phương pháp học mô hình tham số khác, là đi tìm giá trị của tham số để tối ưu hoá hàm thiệt hại (''loss function''). Trong trường hợp của MLE, hàm thiệt hại được định nghĩa là hàm logarithm của hàm khả năng (''likelihood function''): <math>ln(P(D|\theta))</math>.
MLE dựa trên giả thiết rằng các mẫu dữ liệu <math>D=\{X_{1},..,X_{N}\}</math> có được đều [[độc lập và có cùng phân bố]] (i.i.d), với hàm phân bố thuộc một lớp cụ thể (ví dụ như Gaussian hoặc luỹ thừa) với tham số <math>\theta</math> chưa biết. Mục tiêu của MLE, như các phương pháp học mô hình tham số khác, là đi tìm giá trị của tham số để tối ưu hoá hàm thiệt hại (''loss function''). Trong trường hợp của MLE, hàm thiệt hại được định nghĩa là hàm logarithm của hàm khả năng (''likelihood function''): <math>ln(P(D|\theta))</math>.


Theo giả thiết các mẫu dữ liệu là i.i.d ta có hàm khả năng <math>P(D|\theta)=P(X_{1},..,X_{N}|\theta)=\prod\limits_{n=1}^{N} P(X_{n}|\theta)</math>, nên hàm thiệt hại có giá trị: $ln(P(D|\theta)=\sum\limits_{n=1}^{N} ln(P(X_{n}|\theta))$.
Theo giả thiết các mẫu dữ liệu là i.i.d ta có hàm khả năng <math>P(D|\theta)=P(X_{1},..,X_{N}|\theta)=\prod\limits_{n=1}^{N} P(X_{n}|\theta)</math>, nên hàm thiệt hại có giá trị: <math>ln(P(D|\theta)=\sum\limits_{n=1}^{N} ln(P(X_{n}|\theta))</math>.


Tham số của mô hình dựa sẽ được ước lượng bằng các cách gán với các giá trị sao cho hàm <math>log(P(D|\theta))</math> đạt cực đại: <math>
Tham số của mô hình dựa sẽ được ước lượng bằng các cách gán với các giá trị sao cho hàm số trên giá trị đạt cực đại: <math>
\{ \hat\theta_\mathrm{mle}\} \subseteq \{ \underset{\theta\in\Theta}{\operatorname{arg\,max}}\ log(P(D|\theta)) \} </math>. Lưu ý có thể có nhiều giá trị như vậy.
\{ \hat\theta_\mathrm{mle}\} \subseteq \{ \underset{\theta\in\Theta}{\operatorname{arg\,max}}\ log(P(D|\theta)) \} </math>. Lưu ý có thể có nhiều giá trị như vậy.



Phiên bản lúc 12:34, ngày 28 tháng 9 năm 2013

Ước lượng hợp lý cực đại (có người gọi là khả năng cực đại, tiếng Anh thường được viết là MLE, gọi tắt từ Maximum-Likelihood Estimation) là một kỹ thuật trong thống kê dùng để ước lượng giá trị tham số của một mô hình xác suất dựa trên những dữ liệu có được. Phuơng pháp này được nhà toán học R. A. Fisher phát triển vào khoảng 1912-1922. [1], [2]


Nguyên lý

MLE dựa trên giả thiết rằng các mẫu dữ liệu có được đều độc lập và có cùng phân bố (i.i.d), với hàm phân bố thuộc một lớp cụ thể (ví dụ như Gaussian hoặc luỹ thừa) với tham số chưa biết. Mục tiêu của MLE, như các phương pháp học mô hình tham số khác, là đi tìm giá trị của tham số để tối ưu hoá hàm thiệt hại (loss function). Trong trường hợp của MLE, hàm thiệt hại được định nghĩa là hàm logarithm của hàm khả năng (likelihood function): .

Theo giả thiết các mẫu dữ liệu là i.i.d ta có hàm khả năng , nên hàm thiệt hại có giá trị: .

Tham số của mô hình dựa sẽ được ước lượng bằng các cách gán với các giá trị sao cho hàm số trên giá trị đạt cực đại: . Lưu ý có thể có nhiều giá trị như vậy.

Tham khảo

  1. ^ Pfanzagl (1994)
  2. ^ Article (sửa | talk | lịch sử | liên kết | theo dõi | nhật trình)