This is the multi-page printable view of this section. Click here to print.

Return to the regular view of this page.

GraphRAG

探索 GraphRAG 实现 本节详细介绍如何复现 GraphRAG 结果。

    GraphRAG 索引

    为确保实验的一致性和命令的可用性,请按照以下说明安装 GraphRAG:

    conda create -n graphrag python=3.9
    conda activate graphrag
    pip install graphrag==1.2.0
    
    graphrag init --root path/to/main_folder
    

    这将在 main_folder 目录中创建两个文件:

    • .env:包含 GraphRAG 流程的环境变量

      • 定义 GRAPHRAG_API_KEY=<API_KEY> 用于 OpenAI/Azure OpenAI 认证
      • 替换为您自己的 API 密钥
      • 如果使用其他认证方式(如托管身份),请删除此文件
    • settings.yaml:包含可配置的流程设置

      • 修改以自定义流程行为

    有关 GraphRAG 配置和使用的更多详细信息,请参阅官方文档

    然后通过运行以下命令进行索引:

    graphrag index --root path/to/main_folder
    

    回答和评估

    首先,根据基准测试格式准备您的测试问题。您需要创建一个包含问题及其对应答案的测试集 parquet 文件。准备好后,您可以使用以下命令运行评估:

    python -m /eval/eval_graph -f path/to/main_folder -q path/to/question_parquet