Rerank#
介绍#
Rerank 是一种语义搜索工具,它通过基于语义的重新排序系统提高搜索质量,该系统可以根据上下文理解用户查询的含义,而不仅仅是关键字相关性。此工具最适合与查找工具一起使用,作为初始检索后的排序器。当前支持的排序方法列表如下。
名称 |
描述 |
---|---|
BM25 |
BM25 是一种开源排序算法,用于衡量文档与给定查询的相关性 |
Scaled Score Fusion(缩放分数融合) |
Scaled Score Fusion 计算缩放后的相关性分数。 |
Cohere Rerank |
Cohere Rerank 是市场上领先的重新排序模型,用于语义搜索和检索增强生成(RAG)。 |
要求#
对于 AzureML 用户,该工具已安装在默认映像中,无需额外安装即可使用。
对于本地用户,
pip install promptflow-vectordb
先决条件#
BM25 和 Scaled Score Fusion 作为默认的重新排序方法。要使用 Cohere Rerank 模型,您应该为该模型创建无服务器部署,并按如下方式建立工具与资源之间的连接。
添加无服务器模型连接。在“API base”和“API key”字段中填写您的无服务器部署信息。
输入#
名称 |
类型 |
描述 |
必填 |
---|---|---|---|
query |
字符串 |
与您的输入文档相关的问题 |
是 |
ranker_parameters |
字符串 |
要使用的排序方法类型 |
是 |
result_groups |
object |
要重新排序的文档块列表。通常这是查找的输出 |
是 |
top_k |
int |
要返回的最大相关文档数 |
No |
输出#
返回类型 |
描述 |
---|---|
text |
实体的文本 |
metadata |
元数据,如文件路径和 URL |
additional_fields |
元数据和重新排序分数 |
输出
[
{
"text": "sample text",
"metadata":
{
"filepath": "sample_file_path",
"metadata_json_string": "meta_json_string"
"title": "",
"url": ""
},
"additional_fields":
{
"filepath": "sample_file_path",
"metadata_json_string": "meta_json_string"
"title": "",
"url": "",
"@promptflow_vectordb.reranker_score": 0.013795365
}
}
]