GraphRAG

探索 GraphRAG 实现 本节详细介绍如何复现 GraphRAG 结果。

GraphRAG 索引

为确保实验的一致性和命令的可用性,请按照以下说明安装 GraphRAG:

conda create -n graphrag python=3.9
conda activate graphrag
pip install graphrag==1.2.0
graphrag init --root path/to/main_folder

这将在 main_folder 目录中创建两个文件:

  • .env:包含 GraphRAG 流程的环境变量

    • 定义 GRAPHRAG_API_KEY=<API_KEY> 用于 OpenAI/Azure OpenAI 认证
    • 替换为您自己的 API 密钥
    • 如果使用其他认证方式(如托管身份),请删除此文件
  • settings.yaml:包含可配置的流程设置

    • 修改以自定义流程行为

有关 GraphRAG 配置和使用的更多详细信息,请参阅官方文档

然后通过运行以下命令进行索引:

graphrag index --root path/to/main_folder

回答和评估

首先,根据基准测试格式准备您的测试问题。您需要创建一个包含问题及其对应答案的测试集 parquet 文件。准备好后,您可以使用以下命令运行评估:

python -m /eval/eval_graph -f path/to/main_folder -q path/to/question_parquet

Last modified April 5, 2025: update reproduce (f23a25c)