Định nghĩa
Retrieval-Augmented Generation (RAG) là một kỹ thuật kết hợp các mô hình sinh sản với các hệ thống truy xuất thông tin. Kỹ thuật này dựa trên các nguồn bên ngoài để cải thiện độ chính xác thực tế.
Mục đích
Mục đích là giảm ảo giác trong AI tạo sinh bằng cách tăng cường phản hồi với các tài liệu đã thu thập. Nó đặc biệt hữu ích trong việc trả lời câu hỏi và các nhiệm vụ đòi hỏi kiến thức chuyên sâu.
Tầm quan trọng
- Cải thiện độ chính xác thực tế trong kết quả đầu ra của LLM.
- Cho phép tích hợp kiến thức theo từng lĩnh vực cụ thể.
- Yêu cầu hệ thống truy xuất đáng tin cậy.
- Liên quan đến tìm kiếm kết hợp và QA miền mở.
Quy trình triển khai
- Người dùng cung cấp câu hỏi hoặc lời nhắc.
- Hệ thống truy xuất sẽ tìm kiếm các tài liệu có liên quan.
- Tài liệu được chuyển vào mô hình tạo ra.
- Mô hình tạo ra các phản hồi dựa trên nội dung đã thu thập.
- Vòng phản hồi cải thiện hiệu suất trong tương lai.
Ví dụ (Thực tế)
- OpenAI ChatGPT với các plugin duyệt hoặc truy xuất.
- Mô hình Meta RAG: nghiên cứu về LLM dựa trên cơ sở truy xuất.
- Trí tuệ nhân tạo phức tạp: tìm kiếm đàm thoại tăng cường khả năng truy xuất.
Tài liệu tham khảo / Đọc thêm
- Lewis và cộng sự. “Thế hệ tăng cường truy xuất cho NLP chuyên sâu về kiến thức.” NeurIPS 2020.
- Thực hiện RAG ôm mặt.
- Nghiên cứu về phương pháp truy xuất của Stanford HAI.
- RAFT là gì? RAG + Tinh chỉnh