autogen_ext.agents.video_surfer.tools#

extract_audio(video_path: str, audio_output_path: str) str[源代码]#

从视频文件中提取音频,并将其保存为 MP3 文件。

参数:
  • video_path – 视频文件的路径。

  • audio_output_path – 保存提取的音频文件的路径。

返回值:

带有保存的音频文件路径的确认消息。

get_screenshot_at(video_path: str, timestamps: List[float]) List[Tuple[float, ndarray[Any, Any]]][源代码]#

在指定的时间戳捕获屏幕截图,并将其作为 Python 对象返回。

参数:
  • video_path – 视频文件的路径。

  • timestamps – 以秒为单位的时间戳列表。

返回值:

包含时间戳和相应帧(图像)的元组的列表。每个帧都是一个 NumPy 数组(高度 x 宽度 x 通道)。

get_video_length(video_path: str) str[源代码]#

返回视频的长度,以秒为单位。

参数:

video_path – 视频文件的路径。

返回值:

视频的持续时间,以秒为单位。

save_screenshot(video_path: str, timestamp: float, output_path: str) None[源代码]#

在指定的时间戳捕获屏幕截图,并将其保存到输出路径。

参数:
  • video_path – 视频文件的路径。

  • timestamp – 以秒为单位的时间戳。

  • output_path – 保存屏幕截图的路径。文件格式由路径中的扩展名确定。

transcribe_audio_with_timestamps(audio_path: str) str[源代码]#

使用 Whisper 模型转录带有时间戳的音频文件。

参数:

audio_path – 音频文件的路径。

返回值:

带有时间戳的转录。

async transcribe_video_screenshot(video_path: str, timestamp: float, model_client: ChatCompletionClient) str[源代码]#

使用 OpenAI API 转录在指定时间戳捕获的视频屏幕截图的内容。

参数:
  • video_path – 视频文件的路径。

  • timestamp – 以秒为单位的时间戳。

  • model_client – ChatCompletionClient 实例。

返回值:

屏幕截图内容的描述。