Définition
La génération augmentée par récupération (RAG) est une technique qui combine des modèles génératifs et des systèmes de recherche d'information. Elle ancre les résultats dans des sources externes pour améliorer la précision factuelle.
Interet
L'objectif est de réduire les hallucinations dans l'IA générative en enrichissant les réponses avec des documents récupérés. Cette méthode est particulièrement utile pour répondre à des questions et effectuer des tâches exigeantes en connaissances.
Importance
- Améliore l'exactitude factuelle des résultats du LLM.
- Permet l’intégration des connaissances spécifiques au domaine.
- Nécessite des systèmes de récupération fiables.
- Lié à la recherche hybride et à l'assurance qualité en domaine ouvert.
Aide
- L'utilisateur fournit une requête ou une invite.
- Le système de récupération récupère les documents pertinents.
- Les documents sont transmis dans un modèle génératif.
- Le modèle génère des réponses basées sur le contenu récupéré.
- Les boucles de rétroaction améliorent les performances futures.
Exemples (monde réel)
- OpenAI ChatGPT avec plugins de navigation ou de récupération.
- Modèle Meta RAG : recherche sur les LLM basés sur la recherche.
- Perplexity AI : recherche conversationnelle augmentée par récupération.
Références / Lectures complémentaires
- Lewis et al. « Génération augmentée par récupération pour le traitement du langage naturel (NLP) à forte intensité de connaissances. » NeurIPS 2020.
- Mise en œuvre du RAG Hugging Face.
- Recherche HAI de Stanford sur les méthodes de récupération.
- Qu'est-ce que RAFT ? RAG + Fine-Tuning