Hiểu về RMSE – Root Mean Squared Error trong XGBoost

1. RMSE là gì?

RMSE (Root Mean Squared Error) – là căn bậc hai của trung bình bình phương sai số, dùng để đo mức độ sai lệch giữa giá trị thực tế và giá trị dự đoán của mô hình.

📌 RMSE càng thấp → mô hình càng chính xác.

2. Khi nào dùng RMSE?

RMSE thường được dùng khi bạn giải quyết bài toán hồi quy – tức là khi biến mục tiêu (Y)liên tục, ví dụ:

3. Công thức RMSE:

image.png

4. Trực quan hóa RMSE

Hãy tưởng tượng:

5. Ví dụ cụ thể

Giả sử bạn đang dự đoán điểm thi của học sinh, và bạn có:

image.png

6. RMSE bao nhiêu là tốt?

Không có “một con số tuyệt đối” nào cho RMSE tốt, vì:

→ 📌 Hãy so sánh RMSE của mô hình hiện tại với các mô hình khác để đánh giá.

7. RMSE trong XGBoost

XGBoost tự động tối ưu hóa để giảm RMSE (hoặc một hàm lỗi tương tự) trong quá trình huấn luyện khi bạn dùng cho bài toán hồi quy.

Tóm tắt:

Nội dung Ý nghĩa
RMSE Đo sai số trung bình giữa thực tế và dự đoán
Thích hợp cho Bài toán hồi quy
RMSE nhỏ hơn → mô hình tốt hơn Đúng, nhưng cần phụ thuộc vào ngữ cảnh
Dùng để So sánh giữa các mô hình

Tác giả: Đỗ Ngọc Tú
Công Ty Phần Mềm VHTSoft

 


Phiên bản #1
Được tạo 15 tháng 5 2025 10:27:35 bởi Đỗ Ngọc Tú
Được cập nhật 15 tháng 5 2025 10:31:55 bởi Đỗ Ngọc Tú