跳到内容

可视化和调试您的知识图谱

以下分步指南将详细介绍如何在使用 graphrag 构建知识图谱后对其进行可视化。请注意,下面推荐的一些设置是基于我们自己经验中效果良好的设置。您可以随意更改和探索其他设置,以获得更好的可视化体验!

1. 运行管道

在构建索引之前,请检查您的 settings.yaml 配置文件,并确保已启用 graphml 快照。

snapshots:
  graphml: true
(可选)为了支持其他可视化工具和探索,可以启用其他参数以提供对向量嵌入的访问。
embed_graph:
  enabled: true # will generate node2vec embeddings for nodes
umap:
  enabled: true # will generate UMAP embeddings for nodes, giving the entities table an x/y position to plot
在对数据运行索引管道后,将有一个输出文件夹(由 storage.base_dir 设置定义)。

  • 输出文件夹:包含 LLM 索引过程生成的工件。

2. 定位知识图谱

在输出文件夹中,查找名为 graph.graphml 的文件。graphml 是一种标准文件格式,受许多可视化工具支持。我们建议尝试 Gephi

3. 在 Gephi 中打开图谱

  1. 安装并打开 Gephi
  2. 导航到包含各种 parquet 文件的 output 文件夹。
  3. graph.graphml 文件导入 Gephi。这将导致无向图节点和边的视图相当平淡。

A basic graph visualization by Gephi

4. 安装 Leiden 算法插件

  1. 转到 Tools -> Plugins
  2. 搜索“Leiden Algorithm”。
  3. 单击 Install 并重启 Gephi。

5. 运行统计数据

  1. 在右侧的 Statistics 选项卡中,单击 Average DegreeLeiden AlgorithmRun

A view of Gephi's network overview settings

  1. 对于 Leiden 算法,调整设置
  2. 质量函数:模块化
  3. 分辨率: 1

6. 按集群为图谱着色

  1. 转到 Gephi 左上角的 Appearance 面板。

A view of Gephi's appearance pane

  1. 选择 Nodes,然后选择 Partition,并单击右上角的调色板图标。
  2. 从下拉菜单中选择 Cluster
  3. 单击 Palette... 超链接,然后单击 Generate...
  4. 取消选中 Limit number of colors,单击 Generate,然后单击 Ok
  5. 单击 Apply 为图谱着色。这将根据 Leiden 发现的分区为图谱着色。

7. 根据度中心性调整节点大小

  1. 在左上角的 Appearance 面板中,选择 Nodes -> Ranking
  2. 选择右上角的 Sizing 图标。
  3. 选择 Degree 并设置
  4. 最小值: 10
  5. 最大值: 150
  6. 点击 Apply

8. 布置图谱

  1. 在左下角的 Layout 选项卡中,选择 OpenORD

A view of Gephi's layout pane

  1. LiquidExpansion 阶段设置为 50,其他所有项设置为 0。
  2. 单击 Run 并监视进度。

9. 运行 ForceAtlas2

  1. 在布局选项中选择 Force Atlas 2

A view of Gephi's ForceAtlas2 layout pane

  1. 调整设置
  2. 缩放: 15
  3. 劝退枢纽:选中
  4. LinLog 模式:取消选中
  5. 防止重叠:选中
  6. 点击 Run 并等待。
  7. 当图谱节点似乎已稳定且位置不再显著变化时,按下 Stop

10. 添加文本标签(可选)

  1. 在相应部分打开文本标签。
  2. 根据需要配置和调整它们的大小。

您的最终图谱现在应该在视觉上组织良好,并可用于分析!