整个YOLOX源码的学习一定要按照以下顺序才能整体串起来:Backbone->FPN->Head->->数据读入源码->数据增强源码->loss计算源码->simOTA源码->demo.py脚本->train.py脚本。而该系列博文也遵循该顺序来逐行分析代码。注意是逐行,包括python语法,tensor维度和逐行代码的作用及应用。其实网络结构本没有任何神秘的地方,都是一些模块堆叠起来的,你完全可以没有任何理由的修改任何一个模块。看完这个系列后自己完全可以随便的去对任何网络结构做手脚,而不仅仅局限于一个调参者。
本篇讲的是YOLOX中的mosaic数据增强,大多还是opencv的操作。
下图就是一个mosaic增强后的效果图,可以看出:该图像由四张图像拼接,且每张图像都有一定的仿射变换(旋转、平移、resize等)。
我们打开yolox\data\datasets\mosaicdetection.py,从下图所示的地方开始:
版权声明:本文为博主@会飞的毛毛虫原创文章,版权归属原作者,如果侵权,请联系我们删除!
原文链接:https://blog.csdn.net/qq_42308217/article/details/122921871