Ta biết, hàm lồi có các tính chất rất “đẹp” đối với các thuật toán tối ưu hóa. Đặc biệt, cực tiểu cục bộ của hàm lồi cũng là cực tiểu toàn cục. Tính chất này cho phép ước lượng các sai số như hay
, đồng thời còn đảm bảo các thuật toán tối ưu hoạt động khá hiệu quả trên hàm lồi như ta sẽ thấy dưới đây.
Định lý (tốc độ hội tụ của thuật toán ArD): Nếu và
là hàm lồi thì với thuật toán ArD (với tham số
), ta có
- Quỹ đạo
hội tụ đến một cực tiểu toàn cục
nào đó.
- Tốc độ hội tụ của sai số
là
trong đó
là hệ số Lipschitz của
,
là nghiệm ban đầu.
Chứng minh (1): Để cho tiện, đặt
với bất kì (lưu ý là
có thể khác
). Ta có
Vì là hàm lồi nên xấp xỉ Taylor bậc 1 là cận dưới của hàm, ta có
Hơn nữa, do là bước nhảy Armijo nên
Vậy, ta có
Hơn nữa, ta lại có ước lượng của bước nhảy Armijo
nên nếu hay
thì
Tức là khoảng cách không tăng theo
, nói cách khác quỹ đạo
bị chặn. Theo định lý về tính hội tụ của các phương pháp sử dụng đạo hàm, các điểm giới hạn
của quỹ đạo
thỏa mãn tính chất
. Nhưng do
là hàm lồi nên
cũng là cực tiểu toàn cục của
. Ngoài ra, do
là điểm giới hạn của quỹ đạo nên có 1 dãy con hội tụ về
, nhưng do khoảng cách
không tăng theo
nên
hay .
Chứng minh (2): Thay , ta có
Vì (do thuật toán luôn làm giảm hàm mục tiêu) nên
Như vậy, hàm sai số hội tụ về
chậm hơn tuyến tính. Tuy nhiên, nếu hàm lồi
có cận trên và cận dưới là một hàm bậc 2 thì ta có kết quả mạnh hơn, đó là tốc độ hội tụ của thuật toán ArD là tuyến tính.
Định nghĩa (hàm lồi mạnh): Hàm lồi gọi là hàm lồi mạnh (strongly convex) với tham số
nếu
khả vi liên tục và
Định lý (tính chất của hàm lồi mạnh): Nếu là hàm lồi mạnh với tham số
thì
- Tập
là tập compact với mọi
.
- Hàm
là hàm lồi chặt và có cực tiểu toàn cục duy nhất.
- Hàm
là hàm thuộc lớp
với tham số
.
Bổ đề: Hàm là hàm lồi mạnh với tham số
nếu và chỉ nếu
với là giá trị riêng (eigenvalue) bất kì của ma trận Hessian của
tại
.
Chứng minh:
““: Nếu
là hàm lồi mạnh với tham số
, đặt
, ta có
Suy ra
Cho ta được
. Nếu chọn
là vectơ riêng ứng với giá trị riêng
thì
hay . Tương tự, ta cũng có
.
““: Giả sử
trong đó là giá trị riêng bất kì của
với mọi
.
Ta có khai triển Taylor bậc 2 của tại
là
với . Ta lại có
Vậy ta có điều phải chứng minh.
Chứng minh (1): Ta sẽ chứng minh bị chặn dưới. Thật vậy, cố định
, ta có
Vế phải là hàm bậc hai của với hệ số ở lũy thừa 2 dương nên bị chặn dưới, do đó
bị chặn dưới với mọi
. Đặt
, và xét
, ta có
Vế phải là hàm bậc 2 với hệ số ở lũy thừa 2 dương nên chỉ bị chặn trên khi bị chặn trên. Vậy tập
bị chặn. Hơn nữa, do tính liên tục của
, tập
là tập đóng nên cũng là tập compact.
Chứng minh (2): Tập là tập compact nên phải tồn tại cực tiểu của
trong tập này. Rõ ràng, đây cũng là cực tiểu toàn cục của
. Hơn nữa
là hàm lồi chặt nên cực tiểu này là duy nhất (ma trận Hessian xác định dương do
).
Chứng minh (3): Ta có
với . Theo bổ đề trên, ta lại có
Vậy
Tức là là hệ số Lipschitz của
, điều phải chứng minh.
Định lý (tốc độ hội tụ của thuật toán ArD khi hàm mục tiêu lồi mạnh): Nếu là hàm lồi mạnh với tham số
thì với thuật toán ArD (với tham số
), ta có
- Quỹ đạo
hội tụ về cực tiểu duy nhất
.
- Tốc độ hội tụ của hàm sai số
là
với
và
gọi là tỉ số điều kiện (condition number) của hàm
.
- Tốc độ hội tụ của hàm sai số
là
Chứng minh (1): Dễ thấy vì các tính chất trên của hàm lồi mạnh nên các điều kiện của các định lý về tính hội tụ của thuật toán ArD với hàm mục tiêu lồi được thỏa mãn.
Chứng minh (2): Theo định lý trên, ta có
Với điều kiện hàm lồi mạnh, ta có thể ước lượng chính xác hơn
do , vậy
Chứng minh (3): Ta có
Ta lại có
suy ra
Nhận xét:
- Trong trường hợp tổng quát, ta chỉ có thể đánh giá
do hàm mục tiêu có thể có nhiều cực tiểu cục bộ (và các điểm KKT khác).
- Trong trường hợp hàm lồi thuộc lớp
, ta có thể đánh giá được hàm
vì các điểm KKT là cực tiểu toàn cục của hàm mục tiêu. Tuy nhiên ta không thể đánh giá hàm
vì có thể có rất nhiều cực tiểu toàn cục.
- Trong trường hợp hàm lồi mạnh, chỉ có một cực tiểu duy nhất nên ta có điều kiện ước lượng
.
- Tuy tốc độ hội tụ trong trường hợp hàm mục tiêu lồi mạnh là tuyến tính, tỉ lệ hội tụ
phụ thuộc rất nhiều vào tỉ số điều kiện
. Khi
lớn thì
gần bằng
tức là thuật toán hội tụ rất chậm. Trường hợp này ta nói hàm
là hàm có điều kiện tồi (ill-conditioned).
- Những hàm thay đổi mạnh trên một hướng nhưng thay đổi rất ít trên hướng khác là những hàm có điều kiện tồi.
Ví dụ: Thuật toán StD chạy trên hàm, tỉ số điều kiện
- Như vậy, phương pháp tối ưu theo hướng đạo hàm phụ thuộc vào hệ tọa độ quy chiếu, trong ví dụ trên nếu ta đổi biến
thì
, tỉ số điều kiện lúc này là
và thuật toán hội tụ rất nhanh.




