Bất đẳng thức xác suất (2) – Độ tập trung quanh kì vọng (concentration inequalities)
Đăng bởi tqlong on Tháng Sáu 21, 2009
Bất đẳng thức Chebyshev cho ta biết cận trên của xác suất một biến ngẫu nhiên nằm xa kì vọng của nó (tail bound):
Trong bài này ta sẽ tìm hiểu xác suất nằm gần kì vọng của biến với
là các biến ngẫu nhiên độc lập có cùng phân bố xác suất với biến ngẫu nhiên
(independent and identically distributed – i.i.d).
Từ bất đẳng thức Chebyshev
Như vậy, khi , giá trị trung bình
càng gần giá trị kì vọng
(theo nghĩa xác suất).
Để bất đẳng thức chặt hơn, ta có thể dùng bất đẳng thức Chernoff
Bổ đề (Hoeffding): Nếu là biến ngẫu nhiên với
và
thì
Chứng minh: Với mọi , do
là hàm lồi nên
Lấy kì vọng hai vế suy ra
Đặt ta có
Vậy (đpcm).
Tiếp tục áp dụng bổ đề Hoeffding cho biến ngẫu nhiên , nếu
, ta được
Chọn để tối thiểu hóa hàm
ta được
và
Vậy ta có định lý
Định lý (Hoeffding): Nếu là biến ngẫu nhiên với
thì
Tổng quát hơn, nếu là các biến ngẫu nhiên độc lập và
thì
Bất đẳng thức Hoeffding thường được dùng khi đánh giá chất lượng phân lớp bởi giá trị hàm phân lớp thường bị chặn (ví dụ: ).



