Glossaire RAG - Termes et définitions de l'IA documentaire
Glossaire complet des termes RAG, LLM, et intelligence artificielle. Définitions claires des concepts clés pour maîtriser l'IA documentaire.
Termes fondamentaux du RAG
- RAG (Retrieval-Augmented Generation)
- Technique qui améliore les LLM en récupérant des informations pertinentes depuis une base de connaissances externe avant de générer une réponse.
- Embedding
- Représentation vectorielle dense d'un texte qui capture sa signification sémantique. Les textes similaires ont des embeddings proches dans l'espace vectoriel.
- Base de données vectorielle
- Base de données spécialisée pour stocker et rechercher efficacement des vecteurs d'embeddings. Exemples : Qdrant, Pinecone, Weaviate, ChromaDB, Milvus.
- Chunking
- Processus de découpage des documents en segments plus petits pour permettre une récupération plus précise et respecter les limites de contexte du modèle.
- Recherche sémantique
- Recherche basée sur le sens plutôt que sur les mots-clés exacts. Utilise la similarité entre embeddings pour trouver des documents conceptuellement liés.
Termes liés aux LLM
- LLM (Large Language Model)
- Modèle de langage à grande échelle entraîné sur de vastes corpus de texte. Exemples : GPT-4, Claude, Llama, Mistral.
- Fenêtre de contexte
- Le nombre maximum de tokens qu'un modèle peut traiter dans une seule requête.
- Hallucination
- Génération d'informations fausses ou inventées par un LLM. Le RAG réduit ce problème en ancrant les réponses dans des sources vérifiées.
- Fine-tuning
- Entraînement supplémentaire d'un modèle pré-entraîné sur des données spécifiques pour adapter son comportement ou ses connaissances.
Techniques RAG avancées
- Reranking
- Étape qui réordonne les résultats de recherche pour améliorer la pertinence en utilisant des modèles cross-encoder.
- Recherche hybride
- Combinaison de recherche sémantique et recherche lexicale (BM25) pour bénéficier des deux approches.
- Agentic RAG
- RAG où un agent IA décide dynamiquement quand et quoi récupérer, permettant des tâches multi-étapes et un raisonnement complexe.
- GraphRAG
- Extension du RAG qui utilise des graphes de connaissances pour capturer les relations entre entités.
- Self-RAG
- Architecture RAG où le modèle évalue et critique ses propres récupérations et générations.