Trong bài trước, ta đã biết ước lượng rủi ro kì vọng trong trường hợp lớp hàm hữu hạn. Trong bài này, ta sẽ tìm hiểu một công cụ để ước lượng rủi ro kì vọng trong trường hợp
là tập vô hạn.
Định nghĩa (biến ngẫu nhiên Rademacher): Biến ngẫu nhiên là biến ngẫu nghiên Rademacher nếu
và
độc lập với tất cả các sự kiện ngẫu nhiên khác.
Biến ngẫu nhiên Rademacher có thể coi như là một loại nhiễu (noise).
Để ước lượng chênh lệch giữa rủi ro kì vọng và rủi ro thực nghiệm, ta cần ước lượng
Ta thấy , để phân tích tổng quát, ta xét lớp hàm
. Như vậy, với mọi
, có một hàm
tương ứng để
và
.
Như vậy, ta cần ước lượng
Để ý là hàm là một hàm của
biến ngẫu nhiên độc lập
. Do đó nếu
bị chặn trong khoảng
, theo bất đẳng thức McDiarmid, theo nghĩa xác suất, giá trị này phải gần với kì vọng của nó.
Áp dụng bất đẳng thức McDiarmid, do thay đổi chỉ làm hàm này thay đổi nhiều nhất
nên
Chọn ta được
Để tiếp tục ta cần ước lượng giá trị kì vọng
trong đó giá trị kì vọng được tính trên các biến ngẫu nhiên .
Định lý: Gọi là các biến ngẫu nhiên Rademacher. Với mọi lớp hàm
ta có
trong đó gọi là kỳ vọng Rademacher của lớp hàm
. Kì vọng này được tính trên các biến ngẫu nhiên
. Kỳ vọng Rademacher là thuộc tính của một lớp hàm chứ không phải thuộc tính của một hàm cụ thể.
Ta thấy đại lượng là tích vô hướng của 2 véctơ
và
. Như vậy, kì vọng Rademacher đánh giá sự “giống nhiễu” của lớp hàm
.
Chứng minh: Sử dụng một kỹ thuật gọi là tập mẫu giả (ghost sample). Ta xét các biến ngẫu nhiên độc lập có cùng phân bố với
.
(do
)
(quá trình biến đổi đến đây còn gọi là quá trình đối xứng hóa – symmetrization).
(do có cùng phân bố với
)
Hệ quả 1: Do nên
Hệ quả 2: Tiếp tục phân tích bên trên ta được
hay, tương đương với
Bây giờ xét hàm và
, ta có
Với xác suất ít nhất :
(do
)
Áp dụng bất đẳng thức McDiarmid một lần nữa với hàm và
ta được, với xác suất ít nhất
:
Kết hợp lại ta có định lý sau
Định lý: Với hàm lỗi bị chặn trong khoảng ta có
Chứng minh: Xác suất để sự kiện không xảy ra nhiều nhất là
. Xác suất để sự kiện
không xảy ra nhiều nhất là
. Như vậy, xác suất để một trong hai sự kiện không xảy ra nhiều nhất là
(ước lượng xác suất tổng). Nghĩa là xác suất để cả hai sự kiện cùng xảy ra ít nhất là
.
Như vậy chênh lệch rủi ro kì vọng của và
phụ thuộc vào kỳ vọng Rademacher của lớp hàm
. Trong bài sau ta sẽ tìm cách ước lượng kì vọng này.



