概述
场景 | 描述 |
---|---|
分类 | 图像分类是一种监督机器学习技术,用于学习和预测给定图像的类别。 |
相似性 | 图像相似性是一种计算给定一对图像相似度分数的方法。给定一张图像,它允许您在给定数据集中识别最相似的图像。 |
检测 | 对象检测是一种允许您检测图像中对象边界框的技术。 |
关键点 | 关键点检测可用于检测对象上的特定点。提供了一个预训练模型来检测人体姿态估计的身体关节。 |
分割 | 图像分割为图像中的每个像素分配一个类别。 |
动作识别 | 动作识别(也称为活动识别)包括对一系列帧中的各种动作进行分类,例如“阅读”或“饮水”。 |
跟踪 | 跟踪允许随着时间推移在视频序列中检测和跟踪多个对象。 |
场景
尽管计算机视觉领域发展迅速,但大多数视觉应用都属于以下四类之一:
- 图像分类:给定一张输入图像,预测图像中存在什么对象。这通常是解决最简单的计算机视觉问题,但是分类要求对象在图像中相对较大。
- 图像相似性:给定一张输入图像,从参考数据集中查找图像中所有相似的对象。在这里,任务不是预测标签和/或矩形,而是通过参考数据集对找到与查询图像中相似的对象进行排序。
- 对象检测:给定一张输入图像,识别并定位存在哪些对象(使用矩形坐标)。对象检测可以找到图像中的小对象。与图像分类相比,对象检测中的模型训练和手动标注图像更耗时,因为需要标签和位置。
- 关键点检测:给定一张输入图像,识别并定位关键点。概念上,它首先运行一个对象检测器,然后检测对象上的关键点。实际上,一个单一模型(几乎)同时运行这两个步骤。
- 图像分割:给定一张输入图像,为每个像素分配一个标签(例如,背景、瓶子、手、天空等)。实际上,在工业中,这个问题不那么常见,很大程度上是由于训练解决方案所需标注真实分割所需的时间。
数据/遥测
以下笔记本收集浏览器使用数据并将其发送给 Microsoft,以帮助改进我们的产品和服务。
- classification/20_azure_workspace_setup
- classification/21_deployment_on_azure_container_instances
- classification/22_deployment_on_azure_kubernetes_service
- classification/23_aci_aks_web_service_testing
- classification/24_exploring_hyperparameters_on_azureml
- detection/11_exploring_hyperparameters_on_azureml
阅读 Microsoft 的隐私声明了解更多信息。
要选择退出跟踪,请转到原始.ipynb
文件并删除以下代码行(URL会因文件而略有不同)
""