可视化和调试您的知识图谱
以下分步指南将详细介绍如何在使用 graphrag 构建知识图谱后对其进行可视化。请注意,下面推荐的一些设置是基于我们自己经验中效果良好的设置。您可以随意更改和探索其他设置,以获得更好的可视化体验!
1. 运行管道
在构建索引之前,请检查您的 settings.yaml 配置文件,并确保已启用 graphml 快照。
embed_graph:
enabled: true # will generate node2vec embeddings for nodes
umap:
enabled: true # will generate UMAP embeddings for nodes, giving the entities table an x/y position to plot
storage.base_dir 设置定义)。
- 输出文件夹:包含 LLM 索引过程生成的工件。
2. 定位知识图谱
在输出文件夹中,查找名为 graph.graphml 的文件。graphml 是一种标准文件格式,受许多可视化工具支持。我们建议尝试 Gephi。
3. 在 Gephi 中打开图谱
- 安装并打开 Gephi
- 导航到包含各种 parquet 文件的
output文件夹。 - 将
graph.graphml文件导入 Gephi。这将导致无向图节点和边的视图相当平淡。
4. 安装 Leiden 算法插件
- 转到
Tools->Plugins。 - 搜索“Leiden Algorithm”。
- 单击
Install并重启 Gephi。
5. 运行统计数据
- 在右侧的
Statistics选项卡中,单击Average Degree和Leiden Algorithm的Run。
- 对于 Leiden 算法,调整设置
- 质量函数:模块化
- 分辨率: 1
6. 按集群为图谱着色
- 转到 Gephi 左上角的
Appearance面板。
- 选择
Nodes,然后选择Partition,并单击右上角的调色板图标。 - 从下拉菜单中选择
Cluster。 - 单击
Palette...超链接,然后单击Generate...。 - 取消选中
Limit number of colors,单击Generate,然后单击Ok。 - 单击
Apply为图谱着色。这将根据 Leiden 发现的分区为图谱着色。
7. 根据度中心性调整节点大小
- 在左上角的
Appearance面板中,选择Nodes->Ranking - 选择右上角的
Sizing图标。 - 选择
Degree并设置 - 最小值: 10
- 最大值: 150
- 点击
Apply。
8. 布置图谱
- 在左下角的
Layout选项卡中,选择OpenORD。
- 将
Liquid和Expansion阶段设置为 50,其他所有项设置为 0。 - 单击
Run并监视进度。
9. 运行 ForceAtlas2
- 在布局选项中选择
Force Atlas 2。
- 调整设置
- 缩放: 15
- 劝退枢纽:选中
- LinLog 模式:取消选中
- 防止重叠:选中
- 点击
Run并等待。 - 当图谱节点似乎已稳定且位置不再显著变化时,按下
Stop。
10. 添加文本标签(可选)
- 在相应部分打开文本标签。
- 根据需要配置和调整它们的大小。
您的最终图谱现在应该在视觉上组织良好,并可用于分析!