🍨 本文为🔗365天深度学习训练营中的学习记录博客
🍖 原作者：K同学啊|接辅导、项目定制

Table of Contents

说明

上次使用学习了如何运行yolov5检测自己的数据，这次学习yolov5如何训练自己的数据集
本次记录如何使用yolov5训练自己的数据集以及遇到报错解决方案

数据

数据包含了png图片和相应的标注文件

切分数据

代码如下：
其中trainval_percent 和train_percent 代表划分比例
trainval_percent = 1
train_percent = 0.9
代表训练集和验证集为100%，不划分测试集
训练集和验证集为9：1

# coding;utf-8
import os
import random
import argparse
parser = argparse.ArgumentParser()
#xm1文件的地址，根据自己的数据进行修改 xm1一般存放在Annotations下
parser.add_argument('--xml_path', default='Annotations', type=str, help='input xml label path')
#数据集的划分，地址选择自己数据下的ImageSets/Main
parser.add_argument('--txt_path', default='Imagesets/Main', type=str, help='output txt label path')
opt = parser.parse_args()
trainval_percent = 1
train_percent = 0.9
xmlfilepath = opt.xml_path
txtsavepath = opt.txt_path
total_xml = os.listdir(xmlfilepath)
if not os.path.exists(txtsavepath):
    os.makedirs(txtsavepath)
num = len(total_xml)
list_index = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list_index, tv)
train = random.sample(trainval, tr)
file_trainval = open(txtsavepath + '/trainval.txt', 'w')
file_test = open(txtsavepath + '/test.txt', 'w')
file_train = open(txtsavepath + '/train.txt','w')
file_val = open(txtsavepath + '/val.txt','w')

for i in list_index:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        file_trainval.write(name)
        if i in train:
            file_train.write(name)
        else:
            file_val.write(name)
    else:
        file_test.write(name)


file_trainval.close()
file_train.close()
file_val.close()
file_test.close()

处理标注文件

# -*- coding: utf-8 -*-
import xml.etree.ElementTree as ET
import os
from os import getcwd

sets = ['train', 'val', 'test']
classes = ["banana", "snake fruit", "dragon fruit", "pineapple"]
abs_path = os.getcwd()
print(abs_path)

def convert(size, box):
    dw = 1. / (size[0])
    dh = 1. / (size[1])
    x = (box[0] + box[1]) / 2.0 - 1
    y = (box[2] + box[3]) / 2.0 - 1
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return x, y, w, h

def convert_annotation(image_id):
    in_file = open('./annotations/%s.xml' % (image_id), encoding='UTF-8')
    out_file = open('./labels/%s.txt' % (image_id), 'w')
    tree = ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
    for obj in root.iter('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
             float(xmlbox.find('ymax').text))
        b1, b2, b3, b4 = b
        # 标注越界修正
        if b2 > w:
            b2 = w
        if b4 > h:
            b4 = h
        b = (b1, b2, b3, b4)
        bb = convert((w, h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')

wd = getcwd()
for image_set in sets:
    if not os.path.exists('./labels/'):
        os.makedirs('./labels/')
    image_ids = open('./ImageSets/Main/%s.txt' % (image_set)).read().strip().split()
    list_file = open('./%s.txt' % (image_set), 'w')
    for image_id in image_ids:
        list_file.write(abs_path + '/images/%s.png\n' % (image_id)) # 注意你的图片格式，如果是.jpg记得修改
        convert_annotation(image_id)
    list_file.close()

运行会生成训练集、验证集、测试集的数据索引文件train.txt，val.txt，test.txt，并归一化标注信息（labels文件夹下）。

在这里插入图片描述

编辑xx.yaml文件

内置训练集、验证集的索引文件路径，并且写入数据集所有的类别

train: E:\\pythonProject\\y2_data\\train.txt
val:  E:\\pythonProject\\y2_data\\val.txt
nc: 4 # number of classes
names: ['banana','snake fruit','dragon fruit','pineapple'] # 改成自己的类别

在这里插入图片描述

开始训练自己的数据

这里依旧使用的是Anaconda Prompt

python  C:\Users\hepei\dl\yolov5-master\train.py --img 720 --batch 2 --epoch 60 --data C:\Users\hepei\dl\yolov5-master\data\test.yaml --cfg  C:\Users\hepei\dl\yolov5-master\models\yolov5s.yaml --weights weights/yolov5s.pt

报错1

ImportError: Bad git executable.

在这里插入图片描述
按照报错信息找到git下的cmd文件，添加下方代码

os.environ['GIT_PYTHON_REFRESH'] = 'quiet'

在这里插入图片描述
问题解决

报错2

AssertionError: train: All labels empty in E:\pythonProject\y2_data\train.cache, can not start training. See https://github.com/ultralytics/yolov5/wiki/Train-Custom-Data

原因时因为voc_label没有正常生成标签

罪魁祸首是大小写问题，类别开头大写就无法生成标签，labels中的txt文件都是空的，改称小写就好了

classes = ["banana", "snake fruit", "dragon fruit", "pineapple"]

报错3

ImportError: The _imagingft C module is not installed

或者

ImportError: cannot import name 'Image' from 'PIL' (unknown location)

重装pillow：

pip uninstall pillow

pip install pillow

可以解决问题

成功运行

训练过程

在这里插入图片描述

训练结果

在这里插入图片描述

根据保存位置找到结果文件

在这里插入图片描述

看一看效果

在这里插入图片描述

文章出处登录后可见！

已经登录？立即刷新

使用YOLOv5训练自己的数据集

说明

数据

切分数据

处理标注文件

编辑xx.yaml文件

开始训练自己的数据

报错1

报错2

报错3

成功运行

训练过程

训练结果

看一看效果

相关推荐