Thực hành điều chỉnh tham số với LM Studio

LM Studio là một phần mềm giao diện GUI giúp bạn chạy mô hình ngôn ngữ LLM (như Mistral, LLaMA, Phi-2, v.v.) ngay trên máy tính cá nhân, thông qua GGUF và backend như llama.cpp hoặc Ollama.

Trong LM Studio, bạn có thể điều chỉnh các tham số này ở phần Advanced Settings:

Temperature
Top-k
Top-p
Repetition penalty
Max tokens
Sampling mode là mặc định luôn bật (do_sample = true) nếu bạn có temperature > 0.

Bài thực hành 1: Temperature – Điều chỉnh độ ngẫu nhiên

Mục tiêu:

Hiểu cách temperature ảnh hưởng đến mức độ sáng tạo và ổn định của mô hình.

Cách thực hiện:

Mở LM Studio và chọn một mô hình như Mistral-7B Instruct GGUF hoặc bất kỳ mô hình nào bạn đã cài.

Đặt prompt:

Viết một đoạn văn giới thiệu về Việt Nam như thể bạn là một hướng dẫn viên du lịch chuyên nghiệp.

Thử 3 lần với các mức temperature khác nhau:
- 0.1 → Siêu chính xác, ít sáng tạo
- 0.7 → Trung bình, cân bằng giữa sáng tạo và logic
- 1.2 → Rất sáng tạo, nhưng có thể "nói bậy" (hallucinate)
So sánh kết quả.

Kết luận mong đợi:

0.1: Câu trả lời giống sách giáo khoa, ít biến thể.
0.7: Có chút cảm xúc, dùng từ phong phú hơn.
1.2: Có thể thêm chi tiết không đúng sự thật hoặc nói lan man.

Bài thực hành 2: Top-k Sampling – Giới hạn số lượng từ khả thi

Mục tiêu:

Hiểu cách giới hạn lựa chọn từ tiếp theo bằng số lượng cố định.

Cách làm:

Prompt giống như trên.
Giữ temperature ở 0.7.
Thay đổi top_k:
- top_k = 5: Chọn từ trong top 5
- top_k = 50: Từ trong top 50
- top_k = 100: Rộng hơn

Kết luận:

top_k thấp: Câu trả lời dễ đoán, lặp lại nhiều.
top_k cao: Câu trả lời phong phú hơn, đôi khi bất ngờ.

Bài thực hành 3: Top-p Sampling (Nucleus Sampling)

Mục tiêu:

Thay vì số lượng từ, bạn giới hạn theo xác suất cộng dồn.

Cách làm:

Prompt giữ nguyên.
temperature = 0.7, top_k = 0 (tắt top_k).
Thử các giá trị top_p:
- top_p = 0.3 → Chọn từ rất chắc chắn
- top_p = 0.9 → Cho phép đa dạng hơn

Kết luận:

top_p thấp: Trả lời ngắn gọn, an toàn
top_p cao: Phong cách viết đa dạng hơn

Bài thực hành 4: Repetition Penalty – Tránh lặp lại

Mục tiêu:

Ngăn mô hình nói đi nói lại một ý.

Cách làm:

Prompt:

Hãy viết một đoạn giới thiệu ngắn về lợi ích của việc đọc sách.

Chạy với:
- repetition_penalty = 1.0 (mặc định)
- repetition_penalty = 1.2 (tránh lặp nhiều hơn)
- repetition_penalty = 1.5 (rất ghét lặp)

Kết luận:

Không penalty: Có thể lặp cụm như "Đọc sách giúp bạn..." nhiều lần.
Có penalty: Câu trau chuốt hơn, tránh lặp từ.

Bài thực hành 5: Sampling Mode (do_sample = True)

Mục tiêu:

Bật/tắt chế độ lấy mẫu (sampling) – chọn từ ngẫu nhiên hoặc chọn từ xác suất cao nhất.

Cách làm:

Prompt:

Viết một lời chào sáng tạo cho một ứng dụng học tiếng Anh.

So sánh khi:
- do_sample = False (greedy decoding – luôn chọn từ xác suất cao nhất)
- do_sample = True + temperature = 0.7

Kết luận:

do_sample = False: Câu trả lời giống nhau mỗi lần chạy.
do_sample = True: Mỗi lần chạy cho ra câu khác nhau.

Tác giả: Đỗ Ngọc Tú
Công Ty Phần Mềm VHTSoft

Kế hoạch cơ bản cho kỹ thuật tạo lệnh AI

Kiến Trúc Transformer – Cỗ Máy Xử Lý Ngôn Ngữ Đỉnh Cao

Kỹ Thuật Prompt Engineering: Cách Giao Tiếp Hiệu Quả với AI

LM Studio

Lệnh Hướng dẫn rõ ràng và Lệnh một ví dụ

Lệnh vài ví dụ mẫu

Lệnh Tư Duy Chuỗi(Chain of Thought Prompting)

Thử Thách Tư Duy Chuỗi (Chain of Thought) - AI Có Thực Sự Thông Minh?

Kết thúc một hành trình – Bắt đầu một chặng đường mới

Giới thiệu

Tokenization – "Băm nhỏ" ngôn ngữ để AI hiểu, qua thế giới phù thủy Harry Potter

Tìm hiểu về Tokenization với OpenAI Tokenizer

Tạo lệnh với System message

Tham số của mô hình Generative AI trong kiến trúc RAG

Thực hành điều chỉnh tham số với LM Studio

Tổng Kết – Kỹ thuật tạo lệnh & Thực Hành

Giới Thiệu

Ảo giác trong AI (AI hallucination) l

Kỹ thuật Tư Duy Mạch Lạc(Chain of Thought - CoT)

Cây lập luận - (Tree of Thought - ToT)

Kỹ Thuật Nhắc Lập Luận Tương Tự - Analogical Reasoning Prompting(ARP)

Diễn Đạt Lại & Phản Hồi - Rephrase and Respond (RnR)

Kỹ Thuật "Trích Dẫn Nguồn Tin Cậy" - According-to Prompting

Kỹ Thuật "Hội Đồng Chuyên Gia Ảo" - Multi-Persona Collaboration

Kỹ thuật Khơi Gợi Cảm Xúc - Emotion Prompting

Kỹ thuật lập trình sẵn cấu trúc tư duy(Meta Prompting)

Kết chương

Giới thiệu

Giới Thiệu Thế Hệ AI Biết "Suy Nghĩ"

Developer Message và System Message

Kỹ Thuật Symbolic AI

Overthinking – "Chiêu Lừa" LLM bằng Prompt Injection Dựa Trên Suy Luận

Giới thiệu

Giới thiệu

Đa cộng tuyến

XGBoost trong Phân tích Dự báo

Hoạt Động của XGBoost

Những Điểm Đặc Biệt (Quirks) của XGBoost

Bẫy biến giả(Dummy Variable Trap) và Các Bước Tiền Xử Lý Dữ Liệu Trong Machine Learning

Hiểu về RMSE – Root Mean Squared Error trong XGBoost

Overfitting và Underfitting

Bias - Variance Tradeoff

Tối ưu hóa mô hình XGBoost & Bias-Variance Tradeoff

Thực hành điều chỉnh tham số với LM Studio

Bài thực hành 1: Temperature – Điều chỉnh độ ngẫu nhiên

Mục tiêu:

Cách thực hiện:

Kết luận mong đợi:

Bài thực hành 2: Top-k Sampling – Giới hạn số lượng từ khả thi

Mục tiêu:

Cách làm:

Kết luận:

Bài thực hành 3: Top-p Sampling (Nucleus Sampling)

Mục tiêu:

Cách làm:

Kết luận:

Bài thực hành 4: Repetition Penalty – Tránh lặp lại

Mục tiêu:

Cách làm:

Kết luận:

Bài thực hành 5: Sampling Mode (do_sample = True)

Mục tiêu:

Cách làm:

Kết luận:

Không có bình luận