XGBoost trong Phân tích Dự báo

Mục tiêu bài học

1. Tại sao chọn XGBoost?

Việc chọn một thuật toán máy học không phải ngẫu nhiên. Nó phụ thuộc vào:

Trong bài toán tiếp thị trực tiếp của chúng ta (telemarketing), chúng ta cần phân loại nhị phân: khách hàng sẽ trả lời "Yes" hay "No" với chiến dịch?

2. Ưu điểm nổi bật của XGBoost
Ưu điểm Mô tả
Tầm quan trọng của đặc trưng (feature importance) XGBoost cho bạn biết đặc trưng nào có ảnh hưởng lớn nhất đến kết quả. Điều này rất hữu ích để điều chỉnh chiến lược kinh doanh.
Độ chính xác cao XGBoost thường vượt trội hơn so với Logistic Regression, Random Forest, và thậm chí cả Deep Learning trong nhiều trường hợp.
Xử lý song song XGBoost hỗ trợ xử lý song song ngay trong thư viện — giúp tăng tốc huấn luyện.
Tối ưu lặp lại (iterative learning) Mô hình học dần từ sai lầm trong từng vòng lặp, cải thiện chính xác dần theo thời gian.
3. XGBoost là gì?
4. Tree-based vs Linear – Phân biệt 2 cách tiếp cận

Linear (Tuyến tính):

Tree-based (Dạng cây quyết định):

→ Đây chính là cách mà thuật toán cây đưa ra quyết định phân loại. Trực quan, dễ hiểu, và rất hiệu quả với các dữ liệu phức tạp, không tuyến tính.

5. Tại sao chọn tree-based cho XGBoost?
Kết luận

 

Tác giả: Đỗ Ngọc Tú
Công Ty Phần Mềm VHTSoft


Phiên bản #1
Được tạo 15 tháng 5 2025 02:46:30 bởi Đỗ Ngọc Tú
Được cập nhật 15 tháng 5 2025 02:52:42 bởi Đỗ Ngọc Tú