Cơ sở của Hệ thống Truy xuất(Retrieval system)
-
Cơ chế tìm kiếm, truy xuất dữ liệu liên quan đến một truy vấn người dùng (text, hình ảnh, v.v.).
-
Các hệ thống như search engines, document retrieval, question answering…
-
nói về những hệ thống AI như ChatGPT + tìm kiếm dữ liệu, thì "Hệ thống Truy xuất" ở đây ám chỉ kiến trúc Retrieval-Augmented Generation, một dạng mô hình kết hợp:
-
Retrieval module (phần truy xuất)
-
Generation module (phần sinh nội dung)
-
Giới thiệu
Bạn tò mò về "phép thuật" đằng sau những kết quả tìm kiếm? Phần này sẽ bật mí tất cả.Chúng ta sẽ ...
Truy vấn Thông tin (Information Retrieval - IR) - Nền tảng của Hệ thống Tìm kiếm và AI
IR là gì? Tại sao nó quan trọng? Trong bài này, bạn sẽ hiểu rõ Information Retrieval (IR) và tầm...
Từ dừng(Stopwords) và Rút gọn từ về gốc(stemming)
Stopwords và stemming – hai bước rất quan trọng trong quá trình tiền xử lý văn bản trong lĩnh vực...
RAG (Retrieval-Augmented Generation)
Hãy cùng tìm hiểu chi tiết về RAG (Retrieval-Augmented Generation) — một kỹ thuật rất quan trọng ...
Tokenization (Tách Từ) - Nền Tảng Xử Lý Ngôn Ngữ Tự Nhiên (NLP)
Tokenization là gì? Tokenization là quá trình chia nhỏ văn bản thành các đơn vị nhỏ hơn như từ, ...
Hiểu cách hoạt động của Vector Space Model (VSM)
1. Mục tiêu bài học Sau bài học này, bạn sẽ: Hiểu được khái niệm Vector Space Model (VSM). ...
Tầm quan trọng của TF-IDF trong xử lý ngôn ngữ tự nhiên (NLP)
TF-IDF là gì? TF-IDF là viết tắt của: TF – Term Frequency (Tần suất xuất hiện của từ) ...
Mô Hình Truy Xuất Thông Tin Boolean (Boolean Retrieval Model)
1. Mục Tiêu Bài Học Hiểu được khái niệm và cách hoạt động của mô hình Boolean Sử dụng đ...
Thực hành Python: Mô hình Boolean Retrieval
Dây là phần thực hành mô hình Boolean Retrieval bằng Python kèm theo giải thích chi tiết từng bướ...
Mô hình truy xuất xác suất(Probabilistic Retrieval Model)
1. Giới thiệu Mô hình truy xuất xác suất giả định rằng: Mỗi tài liệu có một xác suất liên qua...
LongRAG và LightRAG
1. LongRAG là gì? Định nghĩa: LongRAG là phiên bản mở rộng của RAG để xử lý các tài liệu dài hơ...
Bài Thực Hành LongRAG: Truy Vấn Thông Minh Trên Tài Liệu Dài
Mục tiêu Tải và xử lý văn bản dài (PDF/text) Chia thành các đoạn dài (long chunks) ...