YOLOv5系列 1、制作自己的数据集

YOLOv5系列 1、制作自己的数据集
YOLOv5系列 2、使用yolov5识别自己的数据

文章目录

  • 前言
  • 一、下载Labelme
  • 二、Labelme使用步骤
    • 1.打开Labelme
    • 2.Labelme标记数据集
    • 3.保存为json格式
  • 三、json格式转换为txt格式
  • 四、建立自己的Yolov5数据集

前言

本文所使用的Yolov5为6.1版本,所用为GPU版(亲测CPU也一样能跑,只是速度会慢很多),使用的环境是torch1.7.1+cuda10.1。

一、下载Labelme

Labelme的安装很简单,如果想直接安装就直接在命令行中:

pip install labelme

如果是想把labelme安装在Anaconda的虚拟环境虚拟环境中,则需要先进入虚拟环境中,再安装:

activate 自己的想安装的环境名称
pip install labelme

如果想用Anaconda单独给Labelme装个虚拟环境则:

conda create -n labelme python=3.6
activate labelme
pip install labelme

二、Labelme使用步骤

1.打开Labelme

根据第一步中安装的位置,使用命令行在相应的位置中直接输入labelme,就可打开:

labelme


因为我是直接安装的,所以没有进虚拟环境。打开后就会自动跳出下面这个界面:

上面标注的是我们标记主要使用的功能,先使用Open dir打开我们图像数据所在文件夹:

2.Labelme标记数据集

这边是从kaggle上下载的一个检测口罩的数据集,然后点击Create Polygons,因为是使用Yolov5做的,所以在图像上点击右键,选择create Rectangle,再将口罩框起来。

然后点击ok,继续标记下一个口罩,全部标记好后,点击下一张或者点击保存:

3.保存为json格式


直接进行保存为.json格式即可(这个保存的名字名字是和照片的名字一样的),依照这样一直标记完。

三、json格式转换为txt格式

因为yolov5需要的是照片和txt格式,所以我们得到的json文件不能直接使用,需要先将json转换为txt格式,下面的代码就是将json转为txt

import json
import os

name2id = {'Mask': 0,}  #具体自己数据集类别
               
def convert(img_size, box):
    dw = 1./(img_size[0])
    dh = 1./(img_size[1])
    x = (box[0] + box[2])/2.0 - 1
    y = (box[1] + box[3])/2.0 - 1
    w = box[2] - box[0]
    h = box[3] - box[1]
    x = x*dw
    w = w*dw
    y = y*dh
    h = h*dh
    return (x,y,w,h)
 
def decode_json(json_floder_path,json_name):
    #转换好txt的标签路径
    txt_name = 'E:\\BaiduNetdiskDownload\\PyTorch-YOLOv3\\data\\custom\\labels\\' + json_name[0:-5] + '.txt'    
    txt_file = open(txt_name, 'w')
 
    json_path = os.path.join(json_floder_path, json_name)
    data = json.load(open(json_path, 'r', encoding='gb2312'))
 
    img_w = data['imageWidth']
    img_h = data['imageHeight']
 
    for i in data['shapes']:
        
        label_name = i['label']
        if (i['shape_type'] == 'rectangle'):
 
            x1 = int(i['points'][0][0])
            y1 = int(i['points'][0][1])
            x2 = int(i['points'][1][0])
            y2 = int(i['points'][1][1])
 
            bb = (x1,y1,x2,y2)
            bbox = convert((img_w,img_h),bb)
            txt_file.write(str(name2id[label_name]) + " " + " ".join([str(a) for a in bbox]) + '\n')
    
if __name__ == "__main__":
    #原始json标签路径
    json_floder_path = 'E:\\BaiduNetdiskDownload\\PyTorch-YOLOv3\\data\\custom\\json\\'
    json_names = os.listdir(json_floder_path)
    for json_name in json_names:
        decode_json(json_floder_path,json_name)

这边我们就已经得到了yolov5所需要的txt格式的标签文件。

四、建立自己的Yolov5数据集

我这边建立的数据集文件夹的位置如下:

--MaskDataSet
	--train
		--images
		--labels
	--test
		--images
		--labels
	--valid
		--images
		--labels
	--data.yaml
--yolov5源码位置

其中images放入图片,labels则放入相应的txt标签文件;data.yaml文件内容如下所示:

train: ../MaskDataSet/train/images
test: ../MaskDataSet/test/images
val: ../MaskDataSet/valid/images	
#如果按照上述方式建立文件夹,则上面train、test和val地址可以不变

nc: 1   							#标签类别个数
names: ['Mask',]  					#标签名
#上面nc和names可以根据自己的数据集进行修改

最后,数据集建立成功!下一步,可以开始训练我们标记的数据集啦~

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
心中带点小风骚的头像心中带点小风骚普通用户
上一篇 2023年9月2日
下一篇 2023年9月2日

相关推荐