Overfitting và Underfitting

Khi xây dựng mô hình học máy (Machine Learning), một trong những thách thức lớn nhất là làm sao để mô hình học “vừa đủ” từ dữ liệu. Nếu mô hình học quá ít hoặc quá nhiều, ta sẽ gặp phải 2 hiện tượng:

Underfitting (quá đơn giản)
Overfitting (quá phức tạp)

1. Trực quan hóa: Dữ liệu và mô hình

Dữ liệu:

Giả sử bạn có một tập dữ liệu đơn giản như sau (trên đồ thị):

Trục X: Biến đầu vào
Trục Y: Biến cần dự đoán (target)
Các dấu chấm: dữ liệu thực tế

Ba mô hình khác nhau:

Mô hình	Đặc điểm	Loại lỗi
Đường thẳng đơn giản	Không mô tả hết xu hướng dữ liệu	Underfitting
Đường cong cực phức tạp	Đi qua tất cả các điểm dữ liệu	Overfitting
Đường cong vừa phải	Bắt đúng xu hướng, chấp nhận một số sai lệch	Tối ưu

2. UNDERFITTING là gì?

Mô hình quá đơn giản → không học được mối quan hệ trong dữ liệu
Biểu hiện:
- Sai số cao trên cả training set và test set
Nguyên nhân:
- Dùng mô hình quá đơn giản (VD: hồi quy tuyến tính cho quan hệ phi tuyến)
- Không đủ thời gian huấn luyện
- Sử dụng quá ít đặc trưng (features)

📌 Ví dụ:

Bạn dùng một đường thẳng để mô tả quan hệ giữa lượng học và điểm thi, nhưng dữ liệu thực tế cho thấy quan hệ cong. Mô hình bỏ qua xu hướng cong → sai số cao → underfitting.

3. OVERFITTING là gì?

Mô hình quá phức tạp → học cả nhiễu (noise) trong dữ liệu
Biểu hiện:
- Sai số thấp trên training set nhưng cao trên test set
Nguyên nhân:
- Mô hình quá phức tạp
- Dữ liệu huấn luyện không đủ đa dạng
- Không có regularization (phạt phức tạp)

Ví dụ:

Bạn cho mô hình học “thuộc lòng” từng điểm dữ liệu học sinh (ví dụ: điểm, tuổi, chiều cao), mô hình sẽ dự đoán đúng tuyệt đối trên tập huấn luyện nhưng sai lệch nghiêm trọng khi gặp dữ liệu mới.

Ví dụ về Bias (Underfitting):

Khi còn nhỏ, bạn nghĩ rằng mọi vấn đề đều có thể giải quyết theo một cách duy nhất, do bạn thiếu trải nghiệm và hiểu biết. Bạn giống như một cái búa và nghĩ mọi vấn đề đều là cái đinh → đó là thiên lệch (bias) cao.

Ví dụ về Variance (Overfitting):

Bạn có 40 loại gia vị trong nhà bếp, và cố trộn tất cả lại để tạo ra món ăn “hoàn hảo”. Nhưng thay vì ngon, món ăn lại trở thành lộn xộn → quá nhiều lựa chọn, dẫn đến lỗi cao → phương sai (variance) cao.

Kết luận

Vấn đề	Biểu hiện	Giải pháp chính
Underfitting	Sai số cao ở cả train/test	Mô hình phức tạp hơn, nhiều feature
Overfitting	Sai số thấp ở train, cao ở test	Giảm độ phức tạp, dùng cross-validation
Mục tiêu	Mô hình cân bằng	Tối ưu bias-variance trade-off

Kế hoạch cơ bản cho kỹ thuật tạo lệnh AI

Kiến Trúc Transformer – Cỗ Máy Xử Lý Ngôn Ngữ Đỉnh Cao

Kỹ Thuật Prompt Engineering: Cách Giao Tiếp Hiệu Quả với AI

LM Studio

Lệnh Hướng dẫn rõ ràng và Lệnh một ví dụ

Lệnh vài ví dụ mẫu

Lệnh Tư Duy Chuỗi(Chain of Thought Prompting)

Thử Thách Tư Duy Chuỗi (Chain of Thought) - AI Có Thực Sự Thông Minh?

Kết thúc một hành trình – Bắt đầu một chặng đường mới

Giới thiệu

Tokenization – "Băm nhỏ" ngôn ngữ để AI hiểu, qua thế giới phù thủy Harry Potter

Tìm hiểu về Tokenization với OpenAI Tokenizer

Tạo lệnh với System message

Tham số của mô hình Generative AI trong kiến trúc RAG

Thực hành điều chỉnh tham số với LM Studio

Tổng Kết – Kỹ thuật tạo lệnh & Thực Hành

Giới Thiệu

Ảo giác trong AI (AI hallucination) l

Kỹ thuật Tư Duy Mạch Lạc(Chain of Thought - CoT)

Cây lập luận - (Tree of Thought - ToT)

Kỹ Thuật Nhắc Lập Luận Tương Tự - Analogical Reasoning Prompting(ARP)

Diễn Đạt Lại & Phản Hồi - Rephrase and Respond (RnR)

Kỹ Thuật "Trích Dẫn Nguồn Tin Cậy" - According-to Prompting

Kỹ Thuật "Hội Đồng Chuyên Gia Ảo" - Multi-Persona Collaboration

Kỹ thuật Khơi Gợi Cảm Xúc - Emotion Prompting

Kỹ thuật lập trình sẵn cấu trúc tư duy(Meta Prompting)

Kết chương

Giới thiệu

Giới Thiệu Thế Hệ AI Biết "Suy Nghĩ"

Developer Message và System Message

Kỹ Thuật Symbolic AI

Overthinking – "Chiêu Lừa" LLM bằng Prompt Injection Dựa Trên Suy Luận

Giới thiệu

Giới thiệu

Đa cộng tuyến

XGBoost trong Phân tích Dự báo

Hoạt Động của XGBoost

Những Điểm Đặc Biệt (Quirks) của XGBoost

Bẫy biến giả(Dummy Variable Trap) và Các Bước Tiền Xử Lý Dữ Liệu Trong Machine Learning

Hiểu về RMSE – Root Mean Squared Error trong XGBoost

Overfitting và Underfitting

Bias - Variance Tradeoff

Tối ưu hóa mô hình XGBoost & Bias-Variance Tradeoff

Overfitting và Underfitting

1. Trực quan hóa: Dữ liệu và mô hình

Dữ liệu:

Ba mô hình khác nhau:

2. UNDERFITTING là gì?

3. OVERFITTING là gì?

Ví dụ:

Ví dụ về Bias (Underfitting):

Ví dụ về Variance (Overfitting):

Kết luận

Không có bình luận