Posts in 2025
  • 增量更新

    Sunday, March 16, 2025 in 博客

    在谈到增量更新时,之前的两种方法似乎采取了完全相反的路径。 GraphRAG使用三层Leiden算法在多个层次上抽象原始的同质知识图。Leiden算法的一个主要缺点是,即使只添加几个新节点也可能完全扰乱现有的社区结构。换句话说,尝试更新图可能会迫使你在所有三个层次上重新计算一套全新的社区和摘要。当然,有一些方法可以缓解这个问题,但它们通常会增加显著的复杂性——并浪费宝贵的计算资源。 图1. GraphRAG的社区结构——功能强大,但难以高效更新 另一方面,LightRAG采取了一种简单得多的方 …

    Read more

  • 结构化输出

    Sunday, March 16, 2025 in 博客

    结构化输出在NodeRAG中的挑战 NodeRAG高度依赖于将长文本分解为结构化提示以进行进一步处理。具体来说,它依赖于从较长文本输入中持续生成结构化JSON输出的能力。一方面,我们需要系统在复杂、延伸的任务中保持适当的格式。为实现这一点,我们的项目最初依赖于OpenAI的结构化输出功能(文档在此)。借此,模型可靠地将文本块分解为异构节点,使下游处理变得顺畅高效。 然而,当我们尝试扩展到其他模型时,遇到了一些障碍。例如,OpenAI的结构输出失败(即输出不遵循预期的JSON格式)发生率不 …

    Read more