OpenAI GPT-4V#
介绍#
OpenAI GPT-4V 工具使您能够利用 OpenAI 的 GPT-4 视觉功能(在 API 中也称为 GPT-4V 或 gpt-4-vision-preview),将图像作为输入并回答有关它们的问题。
先决条件#
创建 OpenAI 资源
注册 OpenAI 网站 账户,登录并 查找个人 API 密钥
获取 GPT-4 API 访问权限
要使用带有视觉功能的 GPT-4,您需要访问 GPT-4 API。了解更多关于 如何获取 GPT-4 API 访问权限
连接#
在提示流中设置与已配置资源的连接。
类型 |
名称 |
API 密钥 |
---|---|---|
OpenAI |
必填 |
必填 |
输入#
名称 |
类型 |
描述 |
必填 |
---|---|---|---|
连接 |
OpenAI |
将在工具中使用的 OpenAI 连接 |
是 |
模型 |
字符串 |
要使用的语言模型,目前仅支持 gpt-4-vision-preview |
是 |
提示 |
字符串 |
语言模型将用于生成其响应的文本提示。 |
是 |
max_tokens |
整数 |
在响应中生成的最大令牌数。默认值为 512。 |
No |
temperature |
float |
生成文本的随机性。默认值为 1。 |
No |
stop |
列表 |
生成文本的停止序列。默认值为 null。 |
No |
top_p |
float |
使用生成令牌中最佳选择的概率。默认值为 1。 |
No |
presence_penalty |
float |
控制模型重复短语行为的值。默认值为 0。 |
No |
frequency_penalty |
float |
控制模型生成罕见短语行为的值。默认值为 0。 |
No |
细节 |
字符串 |
控制模型如何处理图像并生成其文本理解,默认为“auto”。 阅读更多 |
No |
输出#
返回类型 |
描述 |
---|---|
字符串 |
对话的一个响应的文本 |