跳到内容

可视化和调试您的知识图谱

以下分步指南将引导您完成可视化知识图谱的过程,该知识图谱由 graphrag 构建。请注意,下面推荐的某些设置基于我们自己的良好经验。欢迎随意更改并探索其他设置,以获得更好的可视化体验!

1. 运行管道

在构建索引之前,请查看您的 settings.yaml 配置文件,并确保已启用 graphml 快照。

snapshots:
  graphml: true
(可选) 为了支持其他可视化工具和探索,可以启用其他参数,这些参数可以提供对向量嵌入的访问。
embed_graph:
  enabled: true # will generate node2vec embeddings for nodes
umap:
  enabled: true # will generate UMAP embeddings for nodes, giving the entities table an x/y position to plot
在您的数据上运行索引管道后,将生成一个输出文件夹(由 storage.base_dir 设置定义)。

  • 输出文件夹:包含来自 LLM 索引传递的工件。

2. 找到知识图谱

在输出文件夹中,查找名为 graph.graphml 的文件。 graphml 是一种标准 文件格式,受到许多可视化工具的支持。我们建议尝试 Gephi

3. 在 Gephi 中打开图

  1. 安装并打开 Gephi
  2. 导航到包含各种 parquet 文件的 output 文件夹。
  3. graph.graphml 文件导入到 Gephi 中。 这将产生一个相当简单的无向图节点和边的视图。

A basic graph visualization by Gephi

4. 安装 Leiden 算法插件

  1. 转到 工具 -> 插件
  2. 搜索“Leiden Algorithm”。
  3. 单击 安装 并重新启动 Gephi。

5. 运行统计

  1. 在右侧的 统计信息 选项卡中,单击 平均度数Leiden 算法运行

A view of Gephi's network overview settings

  1. 对于 Leiden 算法,调整设置
  2. 质量函数:模块化
  3. 分辨率: 1

6. 按聚类着色图

  1. 转到 Gephi 左上角的 外观 窗格。

A view of Gephi's appearance pane

  1. 选择 节点,然后选择 分区,然后单击右上角的调色板图标。
  2. 从下拉列表中选择 聚类
  3. 单击 调色板... 超链接,然后单击 生成...
  4. 取消选中 限制颜色数量,单击 生成,然后单击 确定
  5. 单击 应用 以对图进行着色。 这将根据 Leiden 发现的分区对图进行着色。

7. 按度中心性调整节点大小

  1. 在左上角的 外观 窗格中,选择 节点 -> 排名
  2. 选择右上角的 大小调整 图标。
  3. 选择 度数 并设置
  4. 最小: 10
  5. 最大: 150
  6. 单击 应用

8. 布局图

  1. 在左下角的 布局 选项卡中,选择 OpenORD

A view of Gephi's layout pane

  1. 液体膨胀 阶段设置为 50,其余设置为 0。
  2. 单击 运行 并监控进度。

9. 运行 ForceAtlas2

  1. 在布局选项中选择 Force Atlas 2

A view of Gephi's ForceAtlas2 layout pane

  1. 调整设置
  2. 缩放: 15
  3. 阻止枢纽:已选中
  4. LinLog 模式:未选中
  5. 防止重叠:已选中
  6. 单击 运行 并等待。
  7. 当图节点看起来已稳定并且不再显着改变位置时,按 停止

10. 添加文本标签(可选)

  1. 在相应的部分中打开文本标签。
  2. 根据需要配置并调整它们的大小。

您的最终图现在应该在视觉上组织好,并准备好进行分析!