GraphRAG (DE)

From Systems analysis wiki
Jump to navigation Jump to search

GraphRAG ist ein erweitertes Paradigma der Retrieval-Augmented Generation (RAG), bei dem anstelle der herkömmlichen Suche in unzusammenhängenden Textfragmenten (Chunks) ein Wissensgraph (Knowledge Graph, KG) verwendet wird[1]. Die Graphenstruktur stellt explizit die Verbindungen zwischen Entitäten und die Hierarchie von Fachkonzepten dar, was es LLMs ermöglicht, eine mehrstufige logische Wissensextraktion durchzuführen und kontextbewusstere sowie erklärbarere Antworten zu generieren[2].

Der GraphRAG-Ansatz zeigt signifikante Vorteile gegenüber dem klassischen RAG bei der Bearbeitung komplexer, mehrstufiger (Multi-Hop) Anfragen, bei denen die Antwort von einer Kombination mehrerer Fakten abhängt, die über verschiedene Dokumente verteilt sind[3].

Einschränkungen des klassischen RAG und die Vorteile des Graphen

Klassisches RAG, das auf einer Vektorsuche in unstrukturiertem Text basiert, stößt auf eine Reihe grundlegender Einschränkungen, die in komplexen Unternehmensszenarien kritisch werden:

  • Fehlende strukturelle Verbindungen: Traditionelles RAG verarbeitet Text-Chunks als isolierte Einheiten und erkennt keine expliziten Beziehungen zwischen ihnen. Dies macht es ineffektiv für Multi‑Hop-Anfragen, bei denen die Antwort eine Kette von Fakten (A→B→C) erfordert, die Suche jedoch nur die Anfangs- und Endpunkte (A und C) findet und die Zwischenschritte übersieht[1].
  • Semantische Mehrdeutigkeit: In hochspezialisierten Bereichen (Medizin, Recht, Ingenieurwesen) haben Begriffe spezifische Bedeutungen. Die Vektorsuche, die zwar das allgemeine Thema erfasst, kann die Rolle eines bestimmten Objekts falsch interpretieren, was zur Extraktion von irrelevantem Kontext führt.
  • Eingeschränkte Erklärbarkeit: Klassisches RAG liefert Dokumentenfragmente, aber keinen expliziten Nachweis dafür, wie diese Fragmente zu einer logischen Kette verbunden sind. GraphRAG hingegen macht diesen Prozess transparent, indem es den Pfad im Graphen als Beweis liefert und eine Verknüpfung von Aussagen mit Quellen (Zitaten) erfordert[4].

GraphRAG löst diese Probleme, indem es Wissen als ein Netzwerk verbundener Entitäten und Beziehungen darstellt. Dies ermöglicht dem System, nicht nur ähnlichen Text zu finden, sondern logische Schlussfolgerungen auf der Grundlage eines formalisierten Domänenmodells zu ziehen.

Architektur von GraphRAG

Die allgemeine Pipeline von GraphRAG erweitert das klassische RAG um Schritte zur Erstellung und Nutzung eines Wissensgraphen. Sie gliedert sich in zwei Hauptphasen: die Offline-Vorbereitung und die Online-Verarbeitung der Anfrage.

Phase 1: Ingestion und Indizierung (Offline)

In dieser Phase werden die Quelldaten (Dokumente, Datenbanken) in zwei sich ergänzende Darstellungen umgewandelt: eine graphenbasierte und eine vektorbasierte.

  1. Wissensextraktion: Aus den Texten werden strukturierte Fakten mithilfe einer NLP-Pipeline extrahiert:
    • Named Entity Recognition (NER): Finden von Erwähnungen von Entitäten (Personen, Organisationen, Produkte).
    • Entity Linking (EL): Verknüpfung von Erwähnungen mit kanonischen Identifikatoren im Graphen, um Mehrdeutigkeiten zu beseitigen (z. B. werden „Ivanov I.I.“ und „I. Ivanov“ zu einem Knoten)[5].
    • Relation Extraction (RE): Identifizierung von Beziehungen zwischen Entitäten (z. B. Unternehmen XerwarbStartup Y).
  2. Modellierung und Speicherung des Graphen: Die extrahierten Tripel (Subjekt-Prädikat-Objekt) werden in eine Graphdatenbank geladen. Die Wahl des Modells (Property Graph oder RDF) hängt von der Aufgabe ab. Es ist von entscheidender Bedeutung, die Provenienz (provenance) jedes Fakts zu speichern – einen Verweis auf das Quelldokument und das Textfragment[3]. Dem Graphen können auch Metadaten über die Zeit (valid_from/valid_to) und die Vertrauenswürdigkeit (confidence) hinzugefügt werden.
  3. Hybride Indizierung: Parallel zum Graphen wird ein Vektorindex für die ursprünglichen Textfragmente erstellt. Dies ermöglicht die Kombination der strukturierten Suche im Graphen mit der semantischen Suche im Text.

Phase 2: Anfrageverarbeitung und Antwortgenerierung (Online)

  1. Analyse der Anfrage: Die Benutzeranfrage wird analysiert, um Schlüsselentitäten zu identifizieren, die als „Einstiegspunkte“ in den Graphen dienen.
  2. Extraktion des Subgraphen: Anstatt nach einzelnen Chunks zu suchen, findet GraphRAG einen relevanten Subgraphen – einen zusammenhängenden Teil des Graphen um die „Einstiegspunkte“, der die Informationen für die Antwort enthält. Dafür werden Algorithmen wie der k-Hop-Traversal oder Personalized PageRank (PPR) verwendet[6].
  3. Hybride Suche und Zusammenführung der Ergebnisse: Parallel zur Extraktion des Subgraphen wird eine Suche im Vektor- und/oder lexikalischen (BM25) Index durchgeführt. Die Ergebnisse aus dem Graphen und dem Text werden zusammengeführt und an die nächste Stufe weitergeleitet.
  4. Re-Ranking: Die kombinierte Liste der Kandidaten (Knoten des Graphen und Text-Chunks) wird mit einem präziseren Modell (z. B. einem Cross-Encoder) neu bewertet, um die relevantesten Informationen auszuwählen. Dies hilft, Rauschen zu filtern und die Genauigkeit zu erhöhen[7].
  5. Kontext-Packaging und Generierung: Der ausgewählte und neu bewertete Kontext (Subgraph und Texte) wird in ein für die LLM verständliches Format umgewandelt (z. B. eine Liste von Aussagen mit Quellenangaben). Dieser angereicherte Kontext wird in den Prompt für die Generierung der endgültigen Antwort eingespeist.
  6. Rückverfolgbarkeit und Zitation: Dank der Verknüpfung „Fakt ↔ Quelle“ im Graphen enthält die generierte Antwort präzise Verweise auf die Dokumente, die jede These belegen. Dies gewährleistet eine hohe Nachvollziehbarkeit und Transparenz.

Vergleichstabelle der Komponenten

Vergleichende Analyse der Schlüsselkomponenten der GraphRAG-Architektur
Komponente/Aspekt Implementierungsvarianten Vorteile Nachteile/Risiken Wann zu bevorzugen
Modell des Wissensgraphen RDF/OWL Strenge Ontologie, logische Schlussfolgerungen (Reasoning), Kompatibilität mit Linked Open Data. Schwierig, Attribute von Beziehungen (Zeit, Quelle) ohne zusätzliche Entitäten (Reifikation) zu speichern. Semantisch reichhaltige Domänen mit bestehenden Ontologien; wenn Deduktion erforderlich ist.
Property Graph (Neo4j, etc.) Flexibilität, beliebige Eigenschaften an Knoten/Kanten, hohe Leistung. Erfordert ein klares Schema manuell oder es besteht das Risiko von „Unordnung“; kein einheitlicher Standard. Schneller Einstieg mit unstrukturierten Daten; Integration mit Dokumenten (Multi-Model-DB).
Extraktion des Subgraphen k-Hop BFS / DFS Deckt alle Knoten bis zu einer Tiefe von k ab, einfach zu implementieren. „Graphen-Explosion“: lawinenartiges Wachstum der Knotenzahl; kann viel Rauschen zurückgeben. Kleine Graphen oder Traversierung mit einer Tiefe von 1–2; hierarchische Strukturen.
Personalized PageRank (PPR) Konzentriert sich auf wirklich zusammenhängende Knoten, Rauschen wird herausgefiltert[6]. Kann einen entfernten, aber wichtigen Knoten übersehen (wenn es wenige Pfade gibt, er aber kritisch ist). Komplexe Netzwerke mit vielen Pfaden (soziale Graphen, Zitationsgraphen).
Hybride Suche Kombinierte Liste (Skalarfusion mit Gewicht λ) Die Anpassung der Gewichte λ ermöglicht die Balance zwischen Precision/Recall für die jeweilige Aufgabe[8]. Ein festes λ ist nicht für alle Anfragetypen optimal. In der Prototyping-Phase; wenn bekannt ist, dass eine Quelle von vornherein wichtiger ist.
Cross-Encoder Rerank Signifikanter Anstieg der Genauigkeit; Möglichkeit, komplexe Zusammenhänge zu berücksichtigen. Erhöht die Latenz; erfordert Trainingsdaten oder die Verwendung vorgefertigter Modelle[7]. Szenarien mit hoher Präzision (Recht, Medizin), in denen der maximal relevante Kontext entscheidend ist.
Datensicherheit Filterung des Subgraphen (RBAC/ABAC) Granulare Kontrolle (bis auf Knotenebene) schließt Datenlecks aus. „Blinde Flecken“: Wenn ein wichtiger Knoten entfernt wird, kann die Antwort unvollständig werden. In Unternehmensumgebungen mit strengen Zugriffsanforderungen (PII, GDPR, Geschäftsgeheimnisse).

Rückverfolgbarkeit, Vertrauen und Sicherheit

Einer der Hauptvorteile von GraphRAG ist die Fähigkeit, transparente Beweisketten darzustellen. Anstelle einer „Blackbox“-Antwort kann das System den Argumentationspfad aufzeigen: „Fakt A wird in [doc1] erwähnt. Er ist mit Fakt B [doc2] verbunden, und B führt gemäß [doc3] zu C“, was das Vertrauen des Benutzers erhöht und die Fehlersuche vereinfacht.

Darüber hinaus ermöglicht die Graphenstruktur die Implementierung einer granularen Zugriffskontrolle (RBAC/ABAC). Jeder Knoten oder jede Kante im Graphen kann eine Zugriffskennzeichnung haben. Bei der Extraktion des Subgraphen filtert das System automatisch Daten heraus, auf die der Benutzer keine Rechte hat, und gewährleistet so die Sicherheit in sensiblen Bereichen (Finanzen, Personalwesen, Medizin).

Qualitätsbewertung

Die Bewertung eines GraphRAG-Systems ist ein mehrstufiger Prozess und umfasst Metriken für jede Komponente:

  • Metriken der Wissensextraktion: F1-Score für NER und RE, um die Qualität der Graphenerstellung zu bewerten.
  • Metriken der Subgraphen-Extraktion: Subgraph Recall@K (der Anteil der Fälle, in denen die für die Antwort erforderlichen Knoten/Kanten im extrahierten Subgraphen enthalten waren) und Path Precision/Recall für Multi-Hop-Fragen.
  • Metriken der LLM-Antwort:
    • Faithfulness / Groundedness: Inwieweit stützt sich die Antwort strikt auf den bereitgestellten Kontext.
    • Human evaluation: Bewertung durch Experten nach den Kriterien Richtigkeit, Vollständigkeit und Kohärenz.

Zur Automatisierung der Bewertung werden spezialisierte Benchmarks (z. B. WebQuestionsSP, GrailQA) und Frameworks (z. B. RAGAS) verwendet[9].

Siehe auch

  • Retrieval-Augmented Generation (RAG)
  • Wissensgraph
  • Vektordatenbank
  • Embedding
  • KI-Agent
  • Evaluierung und Benchmarks für LLMs

Literatur

  • Zhang, Q. et al. (2025). A Survey of Graph Retrieval‑Augmented Generation for Customized Large Language Models. arXiv:2501.13958.
  • Xu, Z. et al. (2024). Retrieval‑Augmented Generation with Knowledge Graphs for Customer Service Question Answering. arXiv:2404.17723.
  • Hu, Y. et al. (2024). GRAG: Graph Retrieval‑Augmented Generation. arXiv:2405.16506.
  • Nakano, R. et al. (2021). WebGPT: Browser‑assisted Question‑Answering with Human Feedback. arXiv:2112.09332.
  • Yang, R. et al. (2025). KG‑IRAG: A Knowledge Graph‑Based Iterative Retrieval‑Augmented Generation Framework for Temporal Reasoning. arXiv:2503.14234.
  • Song, Y. et al. (2023). Advancements in Complex Knowledge Graph Question Answering: A Survey. DOI:10.3390/electronics12214395.
  • Nogueira, R.; Cho, K. (2019). Passage Re‑ranking with BERT. arXiv:1901.04085.
  • Hsu, H.‑L.; Tzeng, J. (2025). DAT: Dynamic Alpha Tuning for Hybrid Retrieval in Retrieval‑Augmented Generation. arXiv:2503.23013.
  • Lewis, P. et al. (2020). Retrieval‑Augmented Generation for Knowledge‑Intensive NLP Tasks. arXiv:2005.11401.
  • Karpukhin, V. et al. (2020). Dense Passage Retrieval for Open‑Domain Question Answering. arXiv:2004.04906.
  • Sun, H. et al. (2018). Open‑Domain Question Answering Using Early Fusion of Knowledge Bases and Text (GRAFT‑Net). arXiv:1809.00782.
  • Sun, H.; Bedrax‑Weiss, T.; Cohen, W. W. (2019). PullNet: Open‑Domain Question Answering with Iterative Retrieval on Knowledge Bases and Text. arXiv:1904.09537.
  • He, X. et al. (2024). G‑Retriever: Retrieval‑Augmented Generation for Textual Graph Understanding and Question Answering. arXiv:2402.07630.
  • Es, S.; James, J.; Espinosa‑Anke, L.; Schockaert, S. (2024). RAGAs: Automated Evaluation of Retrieval Augmented Generation. ACL:2024.eacl-demo.16.

Anmerkungen

  1. 1.0 1.1 Zhang, Q., et al. A Survey of Graph Retrieval-Augmented Generation for Customized Large Language Models. arXiv, 2025. arXiv:2501.13958.
  2. Xu, Z., et al. Retrieval-Augmented Generation with Knowledge Graphs for Customer Service Question Answering. SIGIR, 2024. arXiv:2404.17723; DOI: 10.1145/3626772.3661370.
  3. 3.0 3.1 Hu, Y., et al. GRAG: Graph Retrieval‑Augmented Generation. arXiv, 2024. arXiv:2405.16506; auch in Findings of NAACL 2025: ACL Anthology.
  4. Nakano, R., et al. WebGPT: Browser‑assisted question‑answering with human feedback. arXiv, 2021. arXiv:2112.09332.
  5. Yang, R., et al. KG‑IRAG: A Knowledge Graph‑Based Iterative Retrieval‑Augmented Generation Framework for Temporal Reasoning. arXiv, 2025. arXiv:2503.14234.
  6. 6.0 6.1 Song, Y., Li, W., Dai, G., Shang, X. Advancements in Complex Knowledge Graph Question Answering: A Survey. Electronics, 2023. DOI: 10.3390/electronics12214395.
  7. 7.0 7.1 Nogueira, R., Cho, K. Passage Re‑ranking with BERT. arXiv, 2019. arXiv:1901.04085.
  8. Hsu, H.‑L.; Tzeng, J. DAT: Dynamic Alpha Tuning for Hybrid Retrieval in Retrieval‑Augmented Generation. arXiv, 2025. arXiv:2503.23013.
  9. Es, S.; James, J.; Espinosa Anke, L.; Schockaert, S. RAGAs: Automated Evaluation of Retrieval Augmented Generation. EACL (System Demonstrations), 2024. ACL:2024.eacl-demo.16; auch Preprint: arXiv:2309.15217.