说明:最近学习了目标检测的相关知识,做一个简单的记录。建议先学习原理部分,再上代码。每个部分都附有学习视频。
一、目标检测 VS 图像分类 VS 图像分割
理论学习:视频推荐
图像分类只需要对图片进行分类,目标检测,先定位再分类
目标定位/检测:大体定位出框子
语义分割:语义相同的一类颜色,图片中的紫色,像素级
实例分割:每个对象都被准确分割,并进一步
2.目标检测
1、目标检测基础理论
过程:
two stage:
先选择候选框,对框中像素进行特征提取(浅层的:颜色,hog直方图),对框子进行分类判决svw,通过非极大值致抑制的方法进行分类框合并。
one stage:下面蓝色部分,直接预测输出(4个位置+1个置信度+c维的分类情况),而不用上面的那种分别进行pooling抠图,再分类回归的过程。
2、基于深度学习的目标检测
Two-stage流程
One-stage流程
在嵌入式使用中,倾向于使用one-stage速度快
3、人脸业务场景
3.代码实践
锚点和先验框都预先设置了超参数,然后根据训练结果对两者进行微调。
参考1:目标检测先验框和模型原理
参考2:anchor锚点
参考3:代码部署视频,此博主代码已实验过,可以正常运行
版权声明:本文为博主Mr DaYang原创文章,版权归属原作者,如果侵权,请联系我们删除!
原文链接:https://blog.csdn.net/m0_46204224/article/details/123262715