🚀Promptflow 1.13.0 已发布！试试新功能：与 LLM 交互的跟踪。

OpenAI GPT-4V#

介绍#

OpenAI GPT-4V 工具使您能够利用 OpenAI 的 GPT-4 视觉功能（在 API 中也称为 GPT-4V 或 gpt-4-vision-preview），将图像作为输入并回答有关它们的问题。

先决条件#

创建 OpenAI 资源

注册 OpenAI 网站账户，登录并查找个人 API 密钥
获取 GPT-4 API 访问权限

要使用带有视觉功能的 GPT-4，您需要访问 GPT-4 API。了解更多关于如何获取 GPT-4 API 访问权限

连接#

在提示流中设置与已配置资源的连接。

类型	名称	API 密钥
OpenAI	必填	必填

输入#

名称	类型	描述	必填
连接	OpenAI	将在工具中使用的 OpenAI 连接	是
模型	字符串	要使用的语言模型，目前仅支持 gpt-4-vision-preview	是
提示	字符串	语言模型将用于生成其响应的文本提示。	是
max_tokens	整数	在响应中生成的最大令牌数。默认值为 512。	No
temperature	float	生成文本的随机性。默认值为 1。	No
stop	列表	生成文本的停止序列。默认值为 null。	No
top_p	float	使用生成令牌中最佳选择的概率。默认值为 1。	No
presence_penalty	float	控制模型重复短语行为的值。默认值为 0。	No
frequency_penalty	float	控制模型生成罕见短语行为的值。默认值为 0。	No
细节	字符串	控制模型如何处理图像并生成其文本理解，默认为“auto”。阅读更多	No

输出#

返回类型	描述
字符串	对话的一个响应的文本