🤵 Author ：Horizon Max

🏆 神经网络篇：经典网络模型

VOC 2012

它从根本上说是一个有监督的学习问题，提供了一组标记图像的训练集。

包括二十个对象类别：

Person ：person
Animal ：bird, cat, cow, dog, horse, sheep
Vehicle ：aeroplane, bicycle, boat, bus, car, motorbike, train
Indoor ：bottle, chair, dining table, potted plant, sofa, tv/monitor

有三个主要的对象识别竞赛：分类、检测和分割；

VOC 2012

官方链接：VOC 2012
下载链接： training / validation data
官方文档： (VOC2012) 开发套件

分类 / 检测

（1）分类 ：对于 20 个类中的每一个，预测测试图像中该类示例的存在/不存在；
（2）检测 ：从测试图像中的 20 个目标类别中预测每个对象的边界框和标签；

classes

分割

（1）分割：生成逐像素分割，给出在每个像素处可见的对象类别，否则为“背景” ；

[ 数据集 ] VOC 2012 数据集介绍

VOC 2012 文件夹介绍

VOC 2012 文件夹下一共包括 5 个子文件夹
在这里插入图片描述

1）Annotations

文件为 XML格式 的图片标注信息

在这里插入图片描述

以其中一个为例：

在这里插入图片描述

里面包含的信息有：图像数据的名称、地址，目标的种类、位置等；

2）ImageSets

ImageSets 下有 4 个子文件夹

在这里插入图片描述

train.txt：训练集相关数据
val.txt：验证集相关数据
trainval.txt：训练集与验证集合并后的相关数据

Action

1、Action：与人体动作相关的数据，包括三个部分（train.txt、trainval.txt、val.txt），对应的动作有 jumping、phoning 等；

在这里插入图片描述

用于 人体动作分类竞赛 （Action Classification Competition）

在这里插入图片描述

Layout

2、Layout：与人体部位相关的数据，包括三个部分（train.txt、trainval.txt、val.txt），对应的部位有 head、hand、feet 等；

在这里插入图片描述

用于 人体部位检测竞赛 （Person Layout Taster Competition）

在这里插入图片描述

Main

3、Main：与目标检测相关的数据，包括三个部分（train.txt、trainval.txt、val.txt），一共包括 20 个类别；

在这里插入图片描述

用于 图像分类 / 检测竞赛 （Classification/Detection Competitions）

在这里插入图片描述

Segmentation

4、Segmentation：与图像分割相关的数据，包括三个部分（train.txt、trainval.txt、val.txt）

在这里插入图片描述

用于 图像分割竞赛 （Segmentation Competition）

在这里插入图片描述

3）JPEGImages

VOC 2012 数据集提供的所有的 .jpg 格式的图片，训练集和测试集一共 17125 张；

命名格式：“年份_编号.jpg”，与 1）Annotations 中的标签相对应，图片的像素尺寸不相同；

在这里插入图片描述

4）SegmentationClass

语义分割标注掩模图，一共 2913 张；

在这里插入图片描述

5）SegmentationObject

实例分割标注掩模图，一共 2913 张；

在这里插入图片描述

以其中一张 2007_000129.jpg 为例，将 原始图像 、语义分割图像 、实例分割图像 放在一起进行比较：

在这里插入图片描述

原始图像(JPEGImages) ：数据标签都存放在 Annotations 文档内；

语义分割图像(SegmentationClass) ：同一物体类别颜色一样，不同物体类别颜色不同；

实例分割图像 (SegmentationObject) ：同一物体类别和不同物体类别颜色都不同；

2007_000129.jpg 对应的 Annotations 文件：
在这里插入图片描述
<size>：图片尺寸 width、height、depth ；

<object>：图片内的目标（bicycle、person 各有三个 object ）；

<name> ：目标名称，对应着 bicycle、person ；

<pose> ：拍摄角度

<truncated> ：目标检测框是否被截断（1为是，0为否）；

<difficult> ：目标是否难以识别（1为是，0为否）；

<bndbox> ：bounding box 目标框的位置，对应着左上角和右下角的两个坐标；

文章出处登录后可见！

已经登录？立即刷新

[ 数据集 ] VOC 2012 数据集介绍

文章目录

VOC 2012

分类 / 检测

分割

VOC 2012 文件夹介绍

1）Annotations

2）ImageSets

Action

Layout

Main

Segmentation

3）JPEGImages

4）SegmentationClass

5）SegmentationObject

相关推荐