跳过内容。

用于动作识别的视频标注摘要

为了创建用于动作识别的训练或评估集,需要标注视频中动作的真实开始/结束位置。我们研究了各种工具,其中我们最喜欢的工具(迄今为止)是牛津大学 VGG 团队编写的 VGG 图像标注器 (VIA)

VIA 工具使用说明

现在我们将提供一些使用 VIA 工具的技巧/步骤。该工具的完整功能实时演示可以在此处找到。

VIA 工具截图

如何使用该工具进行动作识别

用于 VIA 工具的脚本

VIA 工具将标注输出为 CSV 文件。然而,我们经常需要将每个标注的动作作为其自己的片段写入单独的文件中。这些片段可以作为动作识别模型的训练示例。我们提供了一些脚本来帮助构建此类数据集。

标注工具比较

下面是用于标注动作的替代 UI 列表,但我们认为 VIA 工具是迄今为止表现最好的。我们区分以下两种类型:

另请参阅 HACS 数据集网页,了解展示这两种标注类型的一些示例。

工具名称 标注类型 优点 缺点 是否开源
MuViLab 固定长度片段标注 <ul><li> 通过同时显示多个片段来加速片段标注</li>
<li> 在动作稀疏时特别有用</li></ul>
<ul><li> 当动作非常短(例如一秒)时不适用</li></ul> Github 上开源
VIA (VGG 图像标注器) 分割标注 <ul><li> 轻量级,除了下载 zip 文件外没有其他先决条件</li>
<li> 积极开发的 Gitlab 项目 </li>
<li> 支持:高精度(毫秒和帧)视频标注、预览标注片段、将动作的开始和结束时间导出为 csv、在同一视频上不同轨道标注多个动作 </li>
<li> 易于上手和使用</li></ul>
<ul><li> 代码可能不稳定,例如有时工具会无响应。</li></ul> Gitlab 上开源
ANVIL 分割标注 <ul> <li> 支持高精度标注,导出开始和结束时间。</li></ul> <ul><li> 需要 Java,先决条件更重 </li>
<li> 与 VIA 相比,上手更困难,有许多规范等。 </li>
<li> Java 相关问题可能导致工具难以运行。 </li></ul>
不开源,但可免费下载
动作标注工具 分割标注 <ul><li> 在视频关键帧中添加标签</li>
<li> 支持高精度到毫秒</li></ul>
<ul><li> 与 VIA 或 ANVIL 相比,不便得多</li>
<li> 未积极开发</li></ul>
Github 上开源

参考资料