可视化和调试您的知识图谱
以下分步指南将引导您完成可视化知识图谱的过程,该知识图谱由 graphrag 构建。请注意,下面推荐的某些设置基于我们自己的良好经验。欢迎随意更改并探索其他设置,以获得更好的可视化体验!
1. 运行管道
在构建索引之前,请查看您的 settings.yaml
配置文件,并确保已启用 graphml 快照。
embed_graph:
enabled: true # will generate node2vec embeddings for nodes
umap:
enabled: true # will generate UMAP embeddings for nodes, giving the entities table an x/y position to plot
storage.base_dir
设置定义)。
- 输出文件夹:包含来自 LLM 索引传递的工件。
2. 找到知识图谱
在输出文件夹中,查找名为 graph.graphml
的文件。 graphml 是一种标准 文件格式,受到许多可视化工具的支持。我们建议尝试 Gephi。
3. 在 Gephi 中打开图
- 安装并打开 Gephi
- 导航到包含各种 parquet 文件的
output
文件夹。 - 将
graph.graphml
文件导入到 Gephi 中。 这将产生一个相当简单的无向图节点和边的视图。
4. 安装 Leiden 算法插件
- 转到
工具
->插件
。 - 搜索“Leiden Algorithm”。
- 单击
安装
并重新启动 Gephi。
5. 运行统计
- 在右侧的
统计信息
选项卡中,单击平均度数
和Leiden 算法
的运行
。
- 对于 Leiden 算法,调整设置
- 质量函数:模块化
- 分辨率: 1
6. 按聚类着色图
- 转到 Gephi 左上角的
外观
窗格。
- 选择
节点
,然后选择分区
,然后单击右上角的调色板图标。 - 从下拉列表中选择
聚类
。 - 单击
调色板...
超链接,然后单击生成...
。 - 取消选中
限制颜色数量
,单击生成
,然后单击确定
。 - 单击
应用
以对图进行着色。 这将根据 Leiden 发现的分区对图进行着色。
7. 按度中心性调整节点大小
- 在左上角的
外观
窗格中,选择节点
->排名
- 选择右上角的
大小调整
图标。 - 选择
度数
并设置 - 最小: 10
- 最大: 150
- 单击
应用
。
8. 布局图
- 在左下角的
布局
选项卡中,选择OpenORD
。
- 将
液体
和膨胀
阶段设置为 50,其余设置为 0。 - 单击
运行
并监控进度。
9. 运行 ForceAtlas2
- 在布局选项中选择
Force Atlas 2
。
- 调整设置
- 缩放: 15
- 阻止枢纽:已选中
- LinLog 模式:未选中
- 防止重叠:已选中
- 单击
运行
并等待。 - 当图节点看起来已稳定并且不再显着改变位置时,按
停止
。
10. 添加文本标签(可选)
- 在相应的部分中打开文本标签。
- 根据需要配置并调整它们的大小。
您的最终图现在应该在视觉上组织好,并准备好进行分析!