[ 数据集 ] VOC 2012 数据集介绍


🤵 AuthorHorizon Max

编程技巧篇各种操作小结

🎇 机器视觉篇会变魔术 OpenCV

💥 深度学习篇简单入门 PyTorch

🏆 神经网络篇经典网络模型

💻 算法篇再忙也别忘了 LeetCode


VOC 2012

它从根本上说是一个有监督的学习问题,提供了一组标记图像的训练集。

包括二十个对象类别:

Person :person
Animal :bird, cat, cow, dog, horse, sheep
Vehicle :aeroplane, bicycle, boat, bus, car, motorbike, train
Indoor :bottle, chair, dining table, potted plant, sofa, tv/monitor

有三个主要的对象识别竞赛:分类检测分割

VOC 2012

官方链接 :VOC 2012
下载链接 : training / validation data
官方文档 : (VOC2012) 开发套件


分类 / 检测

(1)分类 :对于 20 个类中的每一个,预测测试图像中该类示例的存在/不存在 ;
(2)检测 :从测试图像中的 20 个目标类别中预测每个对象的边界框和标签 ;

classes


分割

(1)分割:生成逐像素分割,给出在每个像素处可见的对象类别,否则为“背景” ;

[ 数据集 ] VOC 2012 数据集介绍


VOC 2012 文件夹介绍

VOC 2012 文件夹下一共包括 5 个子文件夹
在这里插入图片描述

1)Annotations

文件为 XML格式 的图片标注信息

在这里插入图片描述

以其中一个为例:

在这里插入图片描述

里面包含的信息有:图像数据的 名称、地址,目标的种类、位置等 ;


2)ImageSets

ImageSets 下有 4 个子文件夹

在这里插入图片描述

train.txt:训练集相关数据
val.txt:验证集相关数据
trainval.txt:训练集与验证集合并后的相关数据

Action

1、Action:与人体动作相关的数据,包括三个部分(train.txt、trainval.txt、val.txt),对应的动作有 jumping、phoning 等 ;

在这里插入图片描述

用于 人体动作分类竞赛 (Action Classification Competition)

在这里插入图片描述

Layout

2、Layout:与人体部位相关的数据,包括三个部分(train.txt、trainval.txt、val.txt),对应的部位有 head、hand、feet 等 ;

在这里插入图片描述

用于 人体部位检测竞赛 (Person Layout Taster Competition)

在这里插入图片描述

Main

3、Main:与目标检测相关的数据,包括三个部分(train.txt、trainval.txt、val.txt),一共包括 20 个类别 ;

在这里插入图片描述

用于 图像分类 / 检测竞赛 (Classification/Detection Competitions)

在这里插入图片描述

Segmentation

4、Segmentation:与图像分割相关的数据,包括三个部分(train.txt、trainval.txt、val.txt)

在这里插入图片描述

用于 图像分割竞赛 (Segmentation Competition)

在这里插入图片描述


3)JPEGImages

VOC 2012 数据集提供的所有的 .jpg 格式的图片,训练集和测试集一共 17125 张 ;

命名格式:“年份_编号.jpg”,与 1)Annotations 中的标签相对应,图片的像素尺寸不相同 ;

在这里插入图片描述


4)SegmentationClass

语义分割标注掩模图,一共 2913 张 ;

在这里插入图片描述


5)SegmentationObject

实例分割标注掩模图,一共 2913 张 ;

在这里插入图片描述


以其中一张 2007_000129.jpg 为例,将 原始图像语义分割图像实例分割图像 放在一起进行比较 :

在这里插入图片描述

原始图像(JPEGImages) :数据标签都存放在 Annotations 文档内 ;

语义分割图像(SegmentationClass) :同一物体类别颜色一样,不同物体类别颜色不同 ;

实例分割图像 (SegmentationObject) :同一物体类别 和 不同物体类别颜色都不同 ;

2007_000129.jpg 对应的 Annotations 文件:
在这里插入图片描述
<size>:图片尺寸 width、height、depth ;

<object>:图片内的目标 (bicycle、person 各有三个 object );

<name> :目标名称,对应着 bicycle、person ;

<pose> :拍摄角度

<truncated> :目标检测框是否被截断(1为是,0为否);

<difficult> :目标是否难以识别(1为是,0为否);

<bndbox> :bounding box 目标框的位置,对应着 左上角 和 右下角 的两个坐标 ;



文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
心中带点小风骚的头像心中带点小风骚普通用户
上一篇 2023年3月1日 上午8:29
下一篇 2023年3月1日 上午8:30

相关推荐