Qu’est-ce que la génération augmentée par récupération (RAG) ?

Image d'illustration. IAADN
Le RAG, ou génération augmentée par récupération, est une méthode utilisée sur les grands modèles linguistiques pour rendre leurs résultats plus pertinents pour l'utilisateur final. Curieux de savoir comment cela pourrait améliorer votre expérience avec les IA ?
TL;DR
- Les modèles de langage automatisés (LLM) n’ont pas tenu leurs promesses.
- La génération augmentée par extraction (RAG) améliore la pertinence des LLM.
- Les défis liés à RAG incluent la qualité des données et le biais.
Les limites des modèles de langage automatisés
Alors que les modèles de langage automatisés (LLM) ont documenté d’importantes avancées dans leur capacité à générer du contenu, ils n’ont pas pleinement satisfait les attentes qu’ils ont suscitées. Plusieurs dirigeants qui espéraient que ces modèles augmenteraient l’efficacité et la productivité de leurs entreprises ont été déçus. Pourquoi? La capacité des LLM à opérer dans des environnements nécessitant une connaissance plus nuancée et spécifique à l’entreprise se trouve limitée, car ils sont formés uniquement à partir des informations disponibles pour leurs créateurs.
Qu’est-ce que la génération augmentée par extraction (RAG)?
La génération augmentée par extraction, ou RAG, est un processus appliqué aux LLM afin de rendre leurs résultats plus pertinents dans des contextes spécifiques. Il permet aux LLM d’accéder à des informations extérieures à leur propre base de données avant de générer une réponse. Cela permet de produire des résultats hautement spécifiques sans avoir à effectuer un ajustement ou une formation complète.
Comment fonctionne la RAG ?
Imaginons une grande bibliothèque. La phase « d’ingestion » est comparable à l’approvisionnement et à la création d’un index du contenu, ce qui permet de trouver rapidement n’importe quel livre. La phase de « retrouval » commence ensuite. Lorsqu’un utilisateur pose une question sur un sujet précis, le bibliothécaire utilise l’index pour rendre les livres les plus pertinents. Cette méthode permet à RAG de générer des résultats très spécifiques que les LLM traditionnels ne peuvent pas produire.
Quels sont les défis associés à la RAG ?
« Comme les LLM, la RAG n’est aussi bonne que les données auxquelles elle peut accéder. » Parmi ses défis spécifiques, on note :
- la qualité des données
- la difficulté à lire certaines graphiques ou images
- le biais
- les préoccupations concernant l’accès et la licence des données
En résumé, les LLM améliorés par la RAG peuvent combiner les forces des humains et des machines, permettant aux utilisateurs d’accéder à de vastes sources de connaissances et de générer des réponses plus précises et pertinentes. Dans le futur, on peut s’attendre à une amélioration significative de sa capacité à stimuler l’innovation et à créer de la valeur.