Bias - Variance Tradeoff

1. Định nghĩa cơ bản

Bias (Thiên lệch)

📌 Ví dụ:

Bạn dùng một đường thẳng để dự đoán kết quả học tập, trong khi mối quan hệ thực sự là phi tuyến (cong). Mô hình không đủ khả năng để học mối quan hệ này → kết quả luôn sai → bias cao.

Variance (Phương sai)

📌 Ví dụ:

Một mô hình Decision Tree cực kỳ sâu có thể dự đoán chính xác tất cả điểm huấn luyện, nhưng khi gặp dữ liệu mới sẽ hoạt động rất tệ vì không có khả năng tổng quát.

2. Tổng lỗi (Total Error)

Khi huấn luyện mô hình, Tổng lỗi = Bias² + Variance + Noise

3. Tradeoff – Tại sao cần đánh đổi?

Mục tiêu:

Tìm mô hình vừa đủ — không quá đơn giản cũng không quá phức tạp → Tổng lỗi thấp nhất

Ví dụ thực tế minh họa

Ví dụ 1: Học sinh làm bài toán

Học sinh giỏi sẽ hiểu bản chất, không học vẹt → Bias thấp, Variance thấp

Ví dụ 2: Nấu ăn với gia vị

Người nấu ăn giỏi biết chọn lọc gia vị hợp lý → tạo ra món ngon ổn định

4. Làm sao để giải quyết Tradeoff?

Kỹ thuật Tác dụng
Cross-validation Ước lượng lỗi thực tế để tránh overfitting
Regularization (L1/L2) Phạt độ phức tạp để giảm variance
Giảm chiều dữ liệu Loại bỏ feature gây nhiễu
Ensemble methods Kết hợp nhiều mô hình để giảm variance
Tăng dữ liệu Giảm overfitting nhờ thêm dữ liệu mới

 


Phiên bản #2
Được tạo 15 tháng 5 2025 10:47:44 bởi Đỗ Ngọc Tú
Được cập nhật 15 tháng 5 2025 13:59:19 bởi Đỗ Ngọc Tú