Microsoft publie GraphRAG 2.0 avec intégration améliorée des graphes de connaissances
Microsoft Research dévoile GraphRAG 2.0, avec extraction d'entités améliorée, cartographie des relations, et 40% de meilleure précision sur les requêtes multi-sauts complexes.
Présentation
Microsoft Research a publié GraphRAG 2.0, une mise à jour majeure de leur système de récupération augmenté par graphe qui combine les graphes de connaissances avec la recherche vectorielle traditionnelle pour améliorer les réponses aux questions.
Améliorations principales
Extraction d'entités améliorée
GraphRAG 2.0 introduit un nouveau modèle neuronal d'extraction d'entités qui atteint 92% de précision sur des documents techniques complexes, contre 78% dans la version précédente.
DEVELOPERpython# Example entity extraction entities = graphrag.extract_entities(document) # Output includes: # - Named entities (people, organizations, locations) # - Technical concepts # - Relationships between entities # - Confidence scores
Cartographie des relations
La nouvelle version détecte et cartographie automatiquement les relations entre entités, créant un graphe de connaissances riche qui permet le raisonnement multi-sauts.
Gains de performance :
- Amélioration de 40% sur les questions multi-sauts
- Réduction de 25% des hallucinations
- Meilleure gestion de la désambiguïsation des entités
Architecture de recherche hybride
GraphRAG 2.0 combine trois méthodes de recherche :
- Similarité vectorielle : Recherche sémantique dans les documents
- Traversée de graphe : Suivi des relations entre entités
- Correspondance textuelle : Récupération basée sur les mots-clés
Les résultats sont fusionnés à l'aide d'un modèle de classement appris.
Résultats de benchmark
Testé sur le dataset HotpotQA (questions multi-sauts) :
| Métrique | GraphRAG 1.0 | GraphRAG 2.0 | Amélioration |
|---|---|---|---|
| Exact Match | 52.3% | 73.1% | +39.8% |
| F1 Score | 64.7% | 81.2% | +25.5% |
| Answer Recall | 71.2% | 89.4% | +25.6% |
Cas d'usage
GraphRAG 2.0 excelle particulièrement dans :
- L'analyse d'articles de recherche (suivi des réseaux de citations)
- La revue de documents juridiques (traçabilité des précédents de jurisprudence)
- La documentation technique (compréhension des relations entre composants)
- Les bases de connaissances d'entreprise (connexion d'informations cloisonnées)
Implémentation
Disponible sous forme de package Python open-source :
DEVELOPERpythonfrom graphrag import GraphRAG # Initialize with your documents rag = GraphRAG( documents=documents, embedding_model="text-embedding-3-large", graph_extraction_model="gpt-4" ) # Build knowledge graph rag.build_graph() # Query with graph-aware retrieval answer = rag.query( "How does component A interact with system B?", use_graph_traversal=True, max_hops=3 )
Limitations
Bien que puissant, GraphRAG 2.0 présente certaines contraintes :
- Coût computationnel plus élevé (la construction du graphe est coûteuse)
- Nécessite des données structurées ou semi-structurées pour de meilleurs résultats
- La qualité du graphe dépend de la précision de l'extraction d'entités
- Pas idéal pour les requêtes purement sémantiques/floues
Disponibilité
- Open source sur GitHub
- Supporte OpenAI, Azure OpenAI et les LLMs locaux
- Nécessite Python 3.10+
- Image Docker disponible pour un déploiement facile
Impact sur l'industrie
GraphRAG représente une évolution vers des systèmes de récupération hybrides qui combinent plusieurs paradigmes. Les premiers utilisateurs rapportent des améliorations significatives dans le traitement de requêtes complexes, particulièrement dans des domaines avec de riches relations entre entités.
Directions futures
Microsoft Research a indiqué que les versions futures se concentreront sur :
- L'inférence automatique de schéma de graphe
- Les mises à jour de graphe en temps réel
- Le support d'entités multimodales (images, tableaux)
- La construction de graphes fédérés à travers plusieurs bases de connaissances
Ressources
- GitHub: github.com/microsoft/graphrag
- Article: "GraphRAG 2.0: Graph-Augmented Retrieval for Complex Question Answering"
- Documentation: microsoft.github.io/graphrag
Tags
Articles connexes
Microsoft Research introduit GraphRAG : combinaison des graphes de connaissances avec le RAG
Microsoft Research dévoile GraphRAG, une nouvelle approche qui combine le RAG avec les graphes de connaissances pour améliorer la compréhension contextuelle
Percée de décomposition de requête : DecomposeRAG gère les questions complexes 50% mieux
Les chercheurs d'UC Berkeley introduisent DecomposeRAG, un framework de décomposition de requête automatisé qui améliore significativement les réponses aux questions multi-sauts.
Évaluation automatique du RAG : nouveau framework atteint 95% de corrélation avec les jugements humains
Google Research introduit AutoRAGEval, un framework d'évaluation automatisé qui évalue fiablement la qualité du RAG sans annotation humaine.