Azure AI 语言#

Azure AI 语言使P用户能够使用面向任务且经过优化的预训练或自定义语言模型,有效地理解和分析文档和对话。此 Prompt flow 工具是各种 Azure AI 语言 API 的包装器。当前支持的功能列表如下:

名称

描述

抽象摘要

从文档生成抽象摘要。

提取式摘要

从文档中提取摘要。

对话摘要

总结对话。

实体识别

识别和分类文档中的实体。

关键短语提取

从文档中提取关键短语。

语言检测

检测文档的语言。

PII 实体识别

识别和编辑文档中的 PII 实体。

对话 PII

识别和编辑对话中的 PII 实体。

情感分析

分析文档的情感。

对话式语言理解

预测用户话语中的意图和实体。

翻译器

翻译文档。

要求#

PyPI 包:promptflow-azure-ai-language

先决条件#

该工具调用 Azure AI 语言的 API。要使用它,您必须创建到 Azure AI 语言资源的连接。如果需要,请先创建语言资源

  • 在 Prompt flow 中,添加新的CustomConnection

    • secrets字段下,指定资源的 API 密钥:api_key: <Azure AI Language Resource api key>

    • configs字段下,指定资源的终结点:endpoint: <Azure AI Language Resource endpoint>

要使用Translator工具,您必须设置到 Azure AI Translator 资源的附加连接。如果需要,请先创建 Translator 资源

  • 在 Prompt flow 中,添加新的CustomConnection

    • secrets字段下,指定资源的 API 密钥:api_key: <Azure AI Translator Resource api key>

    • configs字段下,指定资源的终结点:endpoint: <Azure AI Translator Resource endpoint>

    • 如果您的 Translator 资源是区域性而非全球性的,请同时在configs下指定其区域:region: <Azure AI Translator Resource region>

输入#

当工具参数类型为Document时,它需要符合规范的dict对象。

示例

my_document = {
    "id": "1",
    "text": "This is some document text!",
    "language": "en"
}

当工具参数类型为Conversation时,它需要一个dict对象。

示例

my_conversation = {
    "id": "meeting_1",
    "language": "en",
    "modality": "text",
    "domain": "generic",
    "conversationItems": [
        {
            "participantId": "person1",
            "role": "generic",
            "id": "1",
            "text": "Hello!"
        },
        {
            "participantId": "person2",
            "role": "generic",
            "id": "2",
            "text": "How are you?"
        }
    ]
}

所有技能都有以下(可选)输入:

名称

类型

描述

必填

max_retries

int

HTTP 请求的最大重试次数。默认值为5

No

max_wait

int

HTTP 请求之间的最大等待时间(秒)。默认值为60

No

parse_response

bool

是否应解析完整的 API JSON 输出以提取单个任务结果。默认值为False

No

HTTP 请求逻辑采用指数回退。请参阅以下特定于技能的输入:


抽象摘要

名称

类型

描述

必填

连接

CustomConnection

已创建的与 Azure AI 语言资源的连接。

文档

文档

输入文档。

query

字符串

用于构建摘要的查询。

summary_length

字符串(枚举)

所需的摘要长度。枚举值为shortmediumlong

No


提取式摘要

名称

类型

描述

必填

连接

CustomConnection

已创建的与 Azure AI 语言资源的连接。

文档

文档

输入文档。

query

字符串

用于构建摘要的查询。

sentence_count

int

所需的输出摘要句数。默认值为3

No

sort_by

字符串(枚举)

提取式摘要结果的排序标准。枚举值为Offset(按文本中出现的顺序对结果进行排序)和Rank(按模型的重要性(即排名分数)对结果进行排序)。默认值为Offset

No


对话摘要

名称

类型

描述

必填

连接

CustomConnection

已创建的与 Azure AI 语言资源的连接。

对话

对话

输入对话。

summary_aspect

字符串(枚举)

所需的摘要“方面”。枚举值为chapterTitle(获取任何对话的章节标题)、issue(获取客户服务代理和客户之间的网络聊天和服务电话记录中的问题摘要)、narrative(获取任何对话的通用摘要)、resolution(获取客户服务代理和客户之间的网络聊天和服务电话记录中的解决方案摘要)、recap(获取一般摘要)和follow-up tasks(获取后续或行动项的摘要)。


实体识别

名称

类型

描述

必填

连接

CustomConnection

已创建的与 Azure AI 语言资源的连接。

文档

文档

输入文档。


关键短语提取

名称

类型

描述

必填

连接

CustomConnection

已创建的与 Azure AI 语言资源的连接。

文档

文档

输入文档。


语言检测

名称

类型

描述

必填

连接

CustomConnection

已创建的与 Azure AI 语言资源的连接。

text

字符串

输入文本。


PII 实体识别

名称

类型

描述

必填

连接

CustomConnection

已创建的与 Azure AI 语言资源的连接。

文档

文档

输入文档。

字符串(枚举)

用于 PII 实体识别的 PII 域。枚举值为none(无域)或phi(表示应编辑个人健康域中的实体)。默认值为none

No

pii_categories

列表[字符串]

描述要返回的 PII 类别。

No


对话 PII

名称

类型

描述

必填

连接

CustomConnection

已创建的与 Azure AI 语言资源的连接。

对话

对话

输入对话。

pii_categories

列表[字符串]

描述要返回的检测 PII 类别。默认值为['Default']

No

redact_audio_timing

bool

是否应编辑任何检测到的实体的音频流偏移和持续时间。默认值为False

No

编辑源

字符串(枚举)

对于转录对话,此参数提供有关应使用哪种内容类型进行实体检测的信息。检测到的实体的详细信息(例如偏移量、长度和文本本身)将对应于此处选择的文本类型。枚举值为lexicalitnmaskedItntext。默认值为lexical

No

exclude_pii_categories

列表[字符串]

描述要排除的检测 PII 类别。默认值为[]

No


情感分析

名称

类型

描述

必填

连接

CustomConnection

已创建的与 Azure AI 语言资源的连接。

文档

文档

输入文档。

opinion_mining

bool

是否应启用意见挖掘。默认值为False

No


对话式语言理解

名称

类型

描述

必填

连接

CustomConnection

已创建的与 Azure AI 语言资源的连接。

语言

字符串

输入语言的 ISO 639-1 代码。

话语

字符串

单个用户话语或用户话语的 json 数组。

project_name

字符串

要调用的对话式语言理解项目。

deployment_name

字符串

要调用的对话式语言理解项目部署。


翻译器

名称

类型

描述

必填

连接

CustomConnection

已创建的到 Azure AI Translator 资源的连接。

text

字符串

输入文本。

列表[字符串]

要将输入文本翻译成的语言。

source_language

字符串

输入文本的语言。

No

类别

字符串

翻译的类别(域)。此参数用于从使用自定义翻译器构建的自定义系统获取翻译。默认值为general

No

text_type

字符串(枚举)

正在翻译的文本类型。可能的值为plain(默认)或html

No

输出#

  • 当输入参数parse_response设置为False(默认值)时,将返回完整的 API JSON 响应(作为dict对象)。

  • 当输入参数parse_response设置为True时,将解析完整的 API JSON 响应以提取与工具给定技能相关的单个任务结果。输出将取决于技能(但仍将是dict对象)。

  • 注意:对于对话式语言理解 (CLU),输出将是响应列表(完整或已解析),输入中每个检测到的用户话语对应一个响应。

有关 API 响应格式、特定任务结果格式等的详细信息,请参阅 Azure AI 语言的REST API 参考

示例流#

请在此处查找使用promptflow-azure-ai-language包的示例流。

联系方式#

如有任何问题,请联系 Azure AI 语言 (taincidents@microsoft.com)。