LLM 视觉#
介绍#
Prompt flow LLM 视觉工具使您能够利用 AzureOpenAI GPT-4 Turbo 或 OpenAI 的带视觉功能的 GPT-4 来分析图像并提供对图像问题的文本响应。
先决条件#
创建 OpenAI 或 Azure OpenAI 资源
OpenAI
注册 OpenAI 网站 帐户
登录并 查找个人 API 密钥
Azure OpenAI (AOAI)
按照说明创建 Azure OpenAI 资源
浏览至 Azure OpenAI Studio 并使用与您的 Azure OpenAI 资源关联的凭据登录。在登录工作流期间或之后,选择相应的目录、Azure 订阅和 Azure OpenAI 资源。
在“管理”下选择“部署”并选择模型名称:
gpt-4
和模型版本vision-preview
,创建一个带视觉功能的 GPT-4 Turbo 部署。
连接#
在提示流中设置与已配置资源的连接。
类型 |
名称 |
API 密钥 |
API 类型 |
API 版本 |
---|---|---|---|---|
OpenAI |
必填 |
必填 |
- |
- |
AzureOpenAI |
必填 |
必填 |
必填 |
必填 |
输入#
名称 |
类型 |
描述 |
必填 |
---|---|---|---|
模型、部署名称 |
字符串 |
要使用的语言模型 |
是 |
提示 |
字符串 |
语言模型将用于生成其响应的文本提示。 |
是 |
max_tokens |
整数 |
在响应中生成的最大令牌数。默认值为 512。 |
No |
temperature |
float |
生成文本的随机性。默认值为 1。 |
No |
stop |
列表 |
生成文本的停止序列。默认值为 null。 |
No |
top_p |
float |
使用生成令牌中最佳选择的概率。默认值为 1。 |
No |
presence_penalty |
float |
控制模型重复短语行为的值。默认值为 0。 |
No |
frequency_penalty |
float |
控制模型生成罕见短语行为的值。默认值为 0。 |
No |
输出#
返回类型 |
描述 |
---|---|
字符串 |
对话的一个响应的文本 |