Ta đã thấy, Perceptron với thuật toán huấn luyện có thể chỉ ra bộ trọng số phân tách được tập mẫu học. Tuy nhiên, kết quả này hoàn toàn không quan tâm đến phân bố xác suất của dữ liệu mà chỉ tìm cách phân lớp tuyến tính một tập mẫu học cho trước. Trong bài này, ta sẽ tìm hiểu một cách tiếp cận khác để huấn luyện một hàm phân lớp tuyến tính, trong đó có sử dụng các đại lượng thống kê của dữ liệu (ví dụ: giá trị kì vọng, ma trận hiệp phương sai).
Ta đã biết, nếu giả sử dữ liệu từ hai lớp đều tuân theo phân bố chuẩn với ma trận hiệp phương sai giống nhau, ranh giới phân lớp tối ưu là siêu phẳng với vectơ pháp tuyến (trọng số
) là
với là kì vọng,
là ma trận hiệp phương sai của cả 2 lớp đối tượng.
Hàm phân lớp tuyến tính của Fisher (Fisher’s linear discriminant – FLD)
Năm 1936, Fisher gợi ý sử dụng hàm phân lớp tuyến tính sao cho dữ liệu qua ánh xạ tuyến tính sẽ cực đại hóa tỉ số
trong đó:
- Độ phân tách giữa hai lớp sau ánh xạ tuyến tính:
Ta muốn
càng lớn càng tốt (kì vọng của 2 lớp cách xa nhau).
- Tổng phương sai của hai lớp sau ánh xạ tuyến tính:
Ta muốn
càng nhỏ càng tốt (phương sai của 2 lớp nhỏ).
Cực đại hóa :
Đặt , bài toán cực đại hóa
tương đương với
Lấy gradient của theo
và đặt bằng
, ta được
Để ý là , do đó, giá trị cực đại của
đạt tại
Nhận xét:
- Về bản chất, hàm tuyến tính của Fisher chiếu cả 2 lớp đối tượng lên một đường thẳng theo hướng
, và tìm hướng
sao cho ảnh của 2 lớp đối tượng trên đường thẳng này càng dễ phân biệt càng tốt.
- Hướng
là hướng (1 chiều) dễ phân biệt 2 lớp đối tượng nhất. Đây là gợi ý dẫn đến các phương pháp giảm số chiều (dimension reduction) của dữ liệu nhưng vẫn đảm bảo khả năng phân lớp.
- Trong phân tích ở trên không thấy có vai trò của
do
không ảnh hưởng đến tỉ số
. Tuy nhiên, nếu ta giả sử dữ liệu tuân theo phân phối chuẩn thì sau ánh xạ tuyến tính
, ta phải phân lớp trên trục số thực với 2 lớp có kì vọng và phương sai
và có thể áp dụng cách tìm ngưỡng
đã biết ở ví dụ trước.
- Có thể xác định
từ tập các mẫu học bằng phương pháp cực đại hóa khả năng (MLE).




