[論文レビュー] Retrieval-Augmented Generation with Graphs (GraphRAG)
この論文は、グラフ構造データを用いた Retrieval-Augmented Generation を概観し、グラフ上での検索、整理、生成を導く全体的な GraphRAG フレームワークとドメイン特化設計を提案します。
Retrieval-augmented generation (RAG) is a powerful technique that enhances downstream task execution by retrieving additional information, such as knowledge, skills, and tools from external sources. Graph, by its intrinsic "nodes connected by edges" nature, encodes massive heterogeneous and relational information, making it a golden resource for RAG in tremendous real-world applications. As a result, we have recently witnessed increasing attention on equipping RAG with Graph, i.e., GraphRAG. However, unlike conventional RAG, where the retriever, generator, and external data sources can be uniformly designed in the neural-embedding space, the uniqueness of graph-structured data, such as diverse-formatted and domain-specific relational knowledge, poses unique and significant challenges when designing GraphRAG for different domains. Given the broad applicability, the associated design challenges, and the recent surge in GraphRAG, a systematic and up-to-date survey of its key concepts and techniques is urgently desired. Following this motivation, we present a comprehensive and up-to-date survey on GraphRAG. Our survey first proposes a holistic GraphRAG framework by defining its key components, including query processor, retriever, organizer, generator, and data source. Furthermore, recognizing that graphs in different domains exhibit distinct relational patterns and require dedicated designs, we review GraphRAG techniques uniquely tailored to each domain. Finally, we discuss research challenges and brainstorm directions to inspire cross-disciplinary opportunities. Our survey repository is publicly maintained at https://github.com/Graph-RAG/GraphRAG/.
研究の動機と目的
- クエリ処理系、リトリーバ、オーガナイザー、ジェネレーター、グラフデータソースから成る総合的な GraphRAG フレームワークを定義する。
- 多様なドメインとグラフ形式に適合した GraphRAG 手法をレビューする。
- ドメインを横断するグラフ構築手法、ベンチマーク、ツールを要約する。
- 課題を強調し、学際的研究と産業機会を喚起する方向性を提案する。
提案手法
- クエリ処理系、リトリーバ、オーガナイザー、ジェネレーター、グラフデータソースという五つの要素からなる GraphRAG フレームワークを提示する。
- リトリーバーとジェネレーター設計を調整するため、ドメイン固有のグラフ構成とリレーショナルパターンをレビューする。
- GraphRAG 手法を分類し、(例:グラフ走査、GNN、リレーショナルマッチング) に適用するため、グラフ構造データに対する検索手法を適合させる。
- グラフに適合させた five クエリ処理手法(NER、relational extraction、query structuring、query decomposition、query expansion)を議論する。
- ドメイン別の分類(knowledge KG、document、scientific、social、planning、tabular、infrastructure、biological、scene、random graphs)を提供し、データセット/ツールを要約する。
実験結果
リサーチクエスチョン
- RQ1グラフドメイン間で統一された GraphRAG フレームワークとは何か?
- RQ2テキスト/意味信号だけでなく、グラフ構造を活用するようにリトリーバーとジェネレーターをどのように設計すべきか?
- RQ3GraphRAG の設計と展開に不可欠なドメイン固有の考慮事項は何か?
- RQ4GraphRAG の研究と応用における主要な課題と有望な方向性は何か?
主な発見
- 五つのコア要素からなる総合的な GraphRAG フレームワークが提案され、分析されている。
- GraphRAG 手法は、多様なリレーショナルパターンとグラフ形式に対応するため、ドメインごとに専門化されている。
- 十のドメインの分類が、グラフ構築、検索、組織化、生成戦略を導く。
- 調査は、ドメイン横断で使用されるベンチマークデータセットとツールリソースを網羅している。
- 課題と今後の方向性が議論され、学際的な機会の促進と産業応用を促す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。