LLM 视觉#

介绍#

Prompt flow LLM 视觉工具使您能够利用 AzureOpenAI GPT-4 Turbo 或 OpenAI 的带视觉功能的 GPT-4 来分析图像并提供对图像问题的文本响应。

先决条件#

创建 OpenAI 或 Azure OpenAI 资源

  • OpenAI

    注册 OpenAI 网站 帐户

    登录并 查找个人 API 密钥

  • Azure OpenAI (AOAI)

    按照说明创建 Azure OpenAI 资源

    浏览至 Azure OpenAI Studio 并使用与您的 Azure OpenAI 资源关联的凭据登录。在登录工作流期间或之后,选择相应的目录、Azure 订阅和 Azure OpenAI 资源。

    在“管理”下选择“部署”并选择模型名称:gpt-4 和模型版本 vision-preview,创建一个带视觉功能的 GPT-4 Turbo 部署。

连接#

在提示流中设置与已配置资源的连接。

类型

名称

API 密钥

API 类型

API 版本

OpenAI

必填

必填

-

-

AzureOpenAI

必填

必填

必填

必填

输入#

名称

类型

描述

必填

模型、部署名称

字符串

要使用的语言模型

提示

字符串

语言模型将用于生成其响应的文本提示。

max_tokens

整数

在响应中生成的最大令牌数。默认值为 512。

No

temperature

float

生成文本的随机性。默认值为 1。

No

stop

列表

生成文本的停止序列。默认值为 null。

No

top_p

float

使用生成令牌中最佳选择的概率。默认值为 1。

No

presence_penalty

float

控制模型重复短语行为的值。默认值为 0。

No

frequency_penalty

float

控制模型生成罕见短语行为的值。默认值为 0。

No

输出#

返回类型

描述

字符串

对话的一个响应的文本