Ta tìm hiểu chiều VC của một số lớp hàm đơn giản trong bài này. Theo định nghĩa, chiều VC của một lớp khái niệm là số phần tử lớn nhất của một tập có thể bị phá vỡ (shatter) bởi lớp khái niệm này.
Để chỉ ra chiều VC của một lớp khái niệm bằng ta phải chứng minh:
: bằng cách chỉ ra một tập có số phần tử bằng
bị phá vỡ bởi
.
: bằng cách chỉ ra với mọi tập có số phần tử nhiều hơn
thì
không thể phá vỡ được (thường khó hơn mệnh đề trên).
Trong một số trường hợp, ta chỉ xác định được mệnh đề 1 hoặc mệnh đề 2.
Ví dụ 1: Lớp các khoảng đóng trên trục số

Xét lớp khái niệm . Đối với lớp khái niệm này, phá vỡ có nghĩa là gì ? Một tập hợp điểm
bị phá vỡ bởi lớp các khoảng đóng nếu với mọi cách đánh dấu tập điểm này bằng các dấu
, ta đều có thể tìm được một khoảng đóng chỉ chứa các điểm được đánh dấu
.
Ta sẽ chứng minh . Thật vậy, đầu tiên dễ thấy rằng mọi tập 2 điểm
trên trục số đều có thể bị phá vỡ bởi
(với cả 4 cách đánh dấu
cho
ta đều có thể vẽ một khoảng đóng chỉ chứa các điểm có dấu
). Do đó
.
Tuy nhiên, với mọi tập 3 điểm (phân biệt) , nếu ta đánh dấu
thuộc lớp
, còn
là
thì không thể có khoảng đóng nào chứa
mà không chứa
. Do đó
không thể phá vỡ tập 3 điểm bất kì (do không có khái niệm nào chứa
mà không chứa
). Vậy
hay
.
Ví dụ 2: Lớp các hình chữ nhật có cạnh song song với 2 trục của mặt phẳng

Xét lớp khái niệm . Một tập bị phá vỡ bởi
nghĩa là với mọi cách đánh dấu
các điểm của tập này ta đều có một hình chữ nhật chỉ chứa các điểm được đánh dấu
.
Ta sẽ chứng minh . Thật vậy, đầu tiên ta cần chỉ ra một tập có 4 điểm thuộc
bị phá vỡ bởi
. Xét tập 4 điểm gồm 4 đỉnh của một hình thoi có các trục song song với hai trục X, Y. Rõ ràng với mọi cách đánh dấu
ta đều có thể vẽ 1 hình chữ nhật chỉ chứa các dấu
. Suy ra
.

Xét một tập 5 điểm (phân biệt) bất kì trên mặt phẳng. Như vậy tồn tại một điểm không phải là điểm trái nhất hoặc phải nhất hoặc cao nhất hoặc thấp nhất. Đánh dấu điểm này bằng dấu còn 4 điểm còn lại bằng dấu
(như hình trên). Hình chữ nhật bao được 4 dấu
bắt buộc phải chứa cả dấu
. Do đó tập 5 điểm không thể bị phá vỡ. Suy ra
hay
.
Ví dụ 3: Lớp các nửa không gian (phân cách bằng siêu phẳng):

Xét lớp khái niệm là tập tất cả các nửa không gian
xác định bởi véctơ pháp tuyến (normal) và ngưỡng (threshold)
. Đây là một lớp khái niệm rất quan trọng vì rất nhiều hàm phân lớp là hàm phân lớp tuyến tính (perceptron, SVM, RBF).
Ta sẽ chứng minh với
là số chiều của không gian.
Để chứng minh ta cần chỉ ra một tập có
phần tử bị phá vỡ bởi
. Xét tập điểm sau
với
là gốc tọa độ,
là các véc tơ cơ sở trực chuẩn ta vẫn thường sử dụng
. Bây giờ ta xét một cách đánh dấu bất kì các điểm này. Do tính đối xứng của nửa không gian, không mất tính tổng quát giả sử các điểm được đánh dấu
có điểm
và các véctơ được đánh dấu
là
với
. Nếu nửa không gian
chỉ chứa các điểm có dấu
thì
Có rất nhiều cách để chọn như trên. Ví dụ
. Vậy tập điểm trên bị phá vỡ bởi
.
Để chứng minh , ta sử dụng định lý Radon. Theo đó, một tập điểm bất kì gồm
điểm phân biệt có thể tách thành 2 tập con có bao lồi giao nhau. Đánh dấu một tập con bằng dấu
và tập còn lại bằng dấu
. Giả sử có một nửa không gian
nào đó chứa và chỉ chứa tất cả các điểm có dấu
. Suy ra
chứa bao lồi các điểm này (do
là tập lồi), còn
chứa bao lồi của các điểm có dấu
. Suy ra bao lồi của hai tập điểm này không giao nhau, mâu thuẫn với định lý Radon.



