Microsoft veröffentlicht GraphRAG 2.0 mit verbesserter Integration von Wissensgraphen
Microsoft Research stellt GraphRAG 2.0 vor, mit verbesserter Entitätsextraktion, Beziehungsabbildung und einer um 40 % höheren Genauigkeit bei komplexen Multi-Hop-Anfragen.
Vorstellung
Microsoft Research hat GraphRAG 2.0 veröffentlicht, ein großes Update ihres graph-augmented retrieval-Systems, das Wissensgraphen mit traditioneller vector-Suche kombiniert, um die Antworten auf Fragen zu verbessern.
Hauptverbesserungen
Verbesserte Entitätsextraktion
GraphRAG 2.0 führt ein neues neuronales Modell zur Entitätsextraktion ein, das eine Genauigkeit von 92% auf komplexen technischen Dokumenten erreicht, gegenüber 78% in der vorherigen Version.
DEVELOPERpython# Example entity extraction entities = graphrag.extract_entities(document) # Output includes: # - Named entities (people, organizations, locations) # - Technical concepts # - Relationships between entities # - Confidence scores
Kartierung der Beziehungen
Die neue Version erkennt und kartiert automatisch die Beziehungen zwischen Entitäten und erstellt so einen reichhaltigen Wissensgraph, der Multi-Hop-Reasoning ermöglicht.
Leistungsgewinne :
- Verbesserung von 40% bei Multi-Hop-Fragen
- Reduktion der Halluzinationen um 25%
- Bessere Handhabung der Entitäts-Disambiguierung
Hybride Sucharchitektur
GraphRAG 2.0 kombiniert drei Suchmethoden :
- Vector-Ähnlichkeit : Semantische Suche in Dokumenten
- Graph-Traversal : Verfolgung der Beziehungen zwischen Entitäten
- Text-Matching : Retrieval basierend auf Schlüsselwörtern
Die Ergebnisse werden mithilfe eines gelernten Ranking-Modells zusammengeführt.
Benchmark-Ergebnisse
Getestet auf dem Datensatz HotpotQA (Multi-Hop-Fragen) :
| Metrik | GraphRAG 1.0 | GraphRAG 2.0 | Verbesserung |
|---|---|---|---|
| Exact Match | 52.3% | 73.1% | +39.8% |
| F1 Score | 64.7% | 81.2% | +25.5% |
| Answer Recall | 71.2% | 89.4% | +25.6% |
Anwendungsfälle
GraphRAG 2.0 ist besonders stark in :
- Analyse von Forschungsartikeln (Verfolgung von Zitiernetzwerken)
- Überprüfung juristischer Dokumente (Nachverfolgbarkeit von Präzedenzfällen)
- Technische Dokumentation (Verständnis der Beziehungen zwischen Komponenten)
- Unternehmens-Wissensdatenbanken (Verknüpfung isolierter Informationen)
Implementierung
Verfügbar als Open-Source-Python-Paket :
DEVELOPERpythonfrom graphrag import GraphRAG # Initialize with your documents rag = GraphRAG( documents=documents, embedding_model="text-embedding-3-large", graph_extraction_model="gpt-4" ) # Build knowledge graph rag.build_graph() # Query with graph-aware retrieval answer = rag.query( "How does component A interact with system B?", use_graph_traversal=True, max_hops=3 )
Einschränkungen
Trotz seiner Leistungsfähigkeit weist GraphRAG 2.0 einige Einschränkungen auf :
- Höhere Rechenkosten (der Aufbau des Graphen ist kostenintensiv)
- Erfordert strukturierte oder semi-strukturierte Daten für bessere Ergebnisse
- Die Qualität des Graphen hängt von der Genauigkeit der Entitätsextraktion ab
- Nicht ideal für rein semantische/vage Anfragen
Verfügbarkeit
- Open Source auf GitHub
- Unterstützt OpenAI, Azure OpenAI und lokale LLMs
- Erfordert Python 3.10+
- Docker-Image verfügbar für einfache Bereitstellung
Auswirkungen auf die Industrie
GraphRAG stellt einen Fortschritt hin zu hybriden retrieval-Systemen dar, die mehrere Paradigmen kombinieren. Erste Anwender berichten von signifikanten Verbesserungen bei der Verarbeitung komplexer Anfragen, insbesondere in Domänen mit umfangreichen Beziehungen zwischen Entitäten.
Zukünftige Entwicklungen
Microsoft Research hat angegeben, dass sich zukünftige Versionen konzentrieren werden auf :
- Automatische Inferenz von Graph-Schemata
- Echtzeit-Aktualisierungen des Graphen
- Unterstützung multimodaler Entitäten (Bilder, Tabellen)
- Aufbau föderierter Graphen über mehrere Wissensdatenbanken hinweg
Ressourcen
- GitHub: github.com/microsoft/graphrag
- Artikel: "GraphRAG 2.0: Graph-Augmented Retrieval for Complex Question Answering"
- Dokumentation: microsoft.github.io/graphrag
Tags
Verwandte Artikel
Microsoft Research stellt GraphRAG vor: Kombination von Wissensgraphen mit RAG
Microsoft Research stellt GraphRAG vor, einen neuen Ansatz, der RAG mit Wissensgraphen kombiniert, um das kontextuelle Verständnis zu verbessern
BEIR Benchmark 2.0 – Rangliste 2025: Vollständige NDCG@10-Scores & Platzierungen
Vollständige BEIR 2.0-Rangliste mit NDCG@10-Scores für alle Top-Modelle. Vergleichen Sie Voyage, Cohere, BGE, OpenAI im neuesten Benchmark.
Neue Forschung: Der Reranking Cross-Encoder verbessert die RAG-Genauigkeit um 40 %
Eine Studie des MIT zeigt, dass zweistufiges Retrieval mit Reranking Cross-Encoder die einfache Vektorsuche deutlich übertrifft.