En termes simples, le réglage fin augmenté de la récupération, ou RAFT, est une technique d'IA avancée dans laquelle la génération augmentée de la récupération est associée au réglage fin pour améliorer les réponses génératives d'un grand modèle de langage pour des applications spécifiques dans ce domaine particulier.
Il permet aux grands modèles linguistiques de fournir des résultats plus précis, contextuellement pertinents et robustes, en particulier pour les secteurs ciblés comme la santé, le droit et la finance, en intégrant RAG et en affinant.
Composants du RAFT
1. Génération augmentée par récupération
Cette technique améliore les LLM en leur permettant d'accéder à des sources de données externes pendant l'inférence. Ainsi, plutôt que de disposer de connaissances statiques pré-entraînées comme c'est le cas pour de nombreux autres modèles, RAG permet au modèle de rechercher activement des informations dans une base de données ou un référentiel de connaissances en deux clics pour répondre aux requêtes des utilisateurs. Cela ressemble presque à un examen à livre ouvert, dans lequel le modèle consulte les références externes les plus récentes ou d'autres faits pertinents pour le domaine. Autrement dit, à moins d'être associé à une forme d'entraînement qui affine la capacité du modèle à raisonner ou à hiérarchiser les informations récupérées, RAG en lui-même n'affine pas les anciennes capacités.
Caractéristiques du RAG :
- Accès dynamique aux connaissances : Inclut des informations en temps réel recueillies à partir de sources d’informations externes.
- Adaptabilité spécifique au domaine : Les réponses sont basées sur des ensembles de données ciblés.
Limitation: Ne contient pas de mécanismes intégrés permettant de distinguer le contenu pertinent et non pertinent récupéré.
2. Réglage fin
Le réglage fin consiste à entraîner un LLM qui a été pré-entraîné sur des ensembles de données spécifiques à un domaine afin de le développer pour des tâches spécialisées. C'est l'occasion de modifier les paramètres du modèle pour mieux comprendre les termes, le contexte et les nuances spécifiques au domaine. Bien que le réglage fin affine la précision du modèle concernant un domaine spécifique, les données externes ne sont pas du tout utilisées lors de l'inférence, ce qui limite sa réutilisabilité lorsqu'il s'agit de reproduire de manière productive des connaissances en évolution.
Caractéristiques du réglage fin :
- Spécialisation: Convient à une industrie ou à une tâche spécifique pour un modèle particulier.
- Meilleure précision d'inférence : Améliore la précision dans la génération de réponses pertinentes au domaine.
Limites: Des capacités de mise à jour dynamique moins efficaces dans la construction des connaissances.
Comment RAFT combine RAG et Fine-Tuning
Il combine les atouts du RAG et du tuning dans un seul package ancré. Les LLM qui en résultent ne se contentent pas de récupérer les documents pertinents, mais intègrent avec succès ces informations dans leur processus de raisonnement. Cette approche hybride garantit que le modèle maîtrise bien les connaissances du domaine (via le tuning) tout en étant capable d'accéder de manière dynamique aux connaissances extérieures (via RAG).
Mécanique du RAFT

Composition des données de formation :
- Les questions sont couplées à des documents pertinents et à des documents distracteurs (non pertinents).
- Réponses en chaîne de pensée reliant les éléments d'information récupérés à la réponse finale.
Objectifs de la formation en alternance :
Apprenez au modèle à classer un document pertinent au-dessus de tous les éléments de distraction et à améliorer ses capacités de raisonnement en lui demandant des explications étape par étape liées aux documents sources.
Phase d'inférence :
- Les modèles récupèrent les documents les mieux classés via un processus RAG.
- Le réglage fin guide un raisonnement précis et fusionne les données récupérées avec les principales réponses.
Avantages du RAFT
Des taux d'erreurs réduits grâce à la fusion
L'amélioration du développement affiné permet à RAFT d'améliorer considérablement la précision des tâches spécialisées. Au lieu de cela, ses performances dans de nombreux tests, tels que TorchHub, ont enregistré des gains allant jusqu'à 76 % par rapport aux techniques de réglage fin ordinaires.
Robustesse contre les erreurs
RAFT entraîne les modèles à modifier les informations non pertinentes avant de définir des inférences incorrectes résultant de récupérations erronées.
Données en direct
Contrairement aux modèles statiques affinés, les LLM avec RAFT peuvent ingérer de nouvelles informations de manière dynamique, ce qui les rend parfaitement adaptés aux secteurs comme la médecine ou la technologie qui nécessitent une adaptation rapide.
Utilise efficacement les ressources
RAFT gère l'adaptation du domaine de manière très rentable grâce à son utilisation de sources de connaissances externes pour la formation et l'inférence, réduisant ainsi la dépendance à d'énormes ensembles de données étiquetées.
Applications de RAFT dans les applications d'IA spécifiques à un domaine
1. Soins de santé :
- Résumé des articles médicaux.
- Soutenir la prise de décision clinique en fusionnant les dossiers des patients avec des lignes directrices mises à jour.
2. Services juridiques:
- Effectuer des recherches juridiques et des analyses de lois.
- Simplifier la révision des contrats.
3. Finances:
- Fournir des informations financières basées sur les tendances du marché.
- Évaluation des risques à l’aide de données économiques en temps réel.
4. Documentation technique :
- Rédaction de matériel de référence API efficace.
- Répondre aux questions des développeurs avec des références de code.
Défis dans la mise en œuvre du RAFT
La complexité des données
Des ensembles de données spécifiques à un domaine de haute qualité sont nécessaires, ce qui peut souvent être difficile à organiser.
Problèmes d'intégration
L’intégration transparente des connaissances externes dans le processus de raisonnement du modèle nécessite une ingénierie sophistiquée.
Consommation élevée de ressources
La formation des modèles RAFT exige une grande capacité de calcul et d'infrastructure.
Comment Shaip aide à relever les défis du RAFT :
Shaip se distingue particulièrement par la résolution des défis liés aux fonctionnalités de recherche augmentée et de réglage fin (RAFT) dans la fourniture d'ensembles de données de qualité, d'ensembles de données spécifiques à un domaine éminent et de services de données compétents.
La plateforme de supervision des données d'IA de bout en bout garantit que ces entreprises disposent d'une diversité d'ensembles de données, simultanément approuvés par des pratiques éthiques, bien annotés pour former de manière appropriée de grands modèles linguistiques (LLM).
Shaip est spécialisé dans la fourniture de services de données de haute qualité et spécifiques à un domaine, adaptés à des secteurs tels que la santé, la finance et les services juridiques. Grâce à la plateforme Shaip Manage, les chefs de projet définissent des paramètres clairs de collecte de données, des quotas de diversité et des exigences spécifiques au domaine, garantissant ainsi que des modèles comme RAFT reçoivent à la fois des documents pertinents et des éléments de distraction non pertinents pour une formation efficace. La désidentification intégrée des données garantit la conformité aux réglementations en matière de confidentialité telles que la loi HIPAA.
Shaip propose également des annotations avancées sur le texte, l'audio, l'image et la vidéo, garantissant une qualité de premier ordre pour la formation en IA. Avec un réseau de plus de 30,000 XNUMX contributeurs et des équipes gérées par des experts, Shaip évolue efficacement tout en maintenant la précision. En relevant des défis tels que la diversité, l'approvisionnement éthique et l'évolutivité, Shaip aide ses clients à exploiter tout le potentiel des modèles d'IA comme RAFT pour des résultats efficaces.