OpenAI GPT-4V#

介绍#

OpenAI GPT-4V 工具使您能够利用 OpenAI 的 GPT-4 视觉功能(在 API 中也称为 GPT-4V 或 gpt-4-vision-preview),将图像作为输入并回答有关它们的问题。

先决条件#

连接#

在提示流中设置与已配置资源的连接。

类型

名称

API 密钥

OpenAI

必填

必填

输入#

名称

类型

描述

必填

连接

OpenAI

将在工具中使用的 OpenAI 连接

模型

字符串

要使用的语言模型,目前仅支持 gpt-4-vision-preview

提示

字符串

语言模型将用于生成其响应的文本提示。

max_tokens

整数

在响应中生成的最大令牌数。默认值为 512。

No

temperature

float

生成文本的随机性。默认值为 1。

No

stop

列表

生成文本的停止序列。默认值为 null。

No

top_p

float

使用生成令牌中最佳选择的概率。默认值为 1。

No

presence_penalty

float

控制模型重复短语行为的值。默认值为 0。

No

frequency_penalty

float

控制模型生成罕见短语行为的值。默认值为 0。

No

细节

字符串

控制模型如何处理图像并生成其文本理解,默认为“auto”。 阅读更多

No

输出#

返回类型

描述

字符串

对话的一个响应的文本