Loạt bài này nói về một khái niệm quan trọng trong lý thuyết học máy. Đó là chiều VC (Vapnik-Chervonenkis dimension), mang tên hai giáo sư người Nga khám phá ra nó vào năm 1971. Chiều VC cho phép ta ước lượng được xác suất lỗi khi sử dụng hàm phân lớp.
Ta xét bài toán phân lớp các mẫu thuộc không gian mẫu
thành hai lớp
và
. Như vậy, mỗi hàm phân lớp tương ứng 1-1 với một tập con
sao cho
thuộc lớp
.
Định nghĩa (khái niệm – concept): Một tập con của
gọi là một khái niệm.
Như vậy, cho trước một không gian mẫu , mỗi khái niệm cho ta biết lớp
gồm những mẫu nào và lớp
sẽ bao gồm các mẫu còn lại.
Định nghĩa (lớp khái niệm – concept class): Một tập các khái niệm gọi là một lớp khái niệm.
Lớp khái niệm cho phép ta khoanh vùng các khái niệm cần “học”. Khi đã có lớp khái niệm, “học” là việc chọn trong lớp khái niệm ra một khái niệm phù hợp với các thông tin đầu vào nhất (ví dụ: phù hợp với tập mẫu học).
Ví dụ:
- Giả sử không gian mẫu là trục số
. Xét lớp khái niệm bao gồm các đoạn đóng trên
:

- Giả sử không gian mẫu là mặt phẳng
. Xét lớp khái niệm bao gồm các hình chữ nhật có cạnh song song với các trục:

- Giả sử không gian mẫu là
. Xét lớp khái niệm bao gồm các hình cầu:




