🤵 Author ：Horizon Max

✨ 编程技巧篇：各种操作小结

🎇 机器视觉篇：会变魔术 OpenCV

💥 深度学习篇：简单入门 PyTorch

🏆 神经网络篇：经典网络模型

🚀 Regions with CNN features

近年来，目标检测性能在标准 PASCAL VOC 数据集上保持稳定；

性能最好的方法是复杂的集成系统（complex ensemble systems），通过将多个低维图像特征与高维背景结合；

利用 候选区域( region proposals )与 CNN 相结合 的方式，实现了平均精度（mAP）提高了30%以上；

R-CNN 与 OverFeat（最近提出的一种基于类似CNN结构的滑动窗口检测器）相比，性能大大优于OverFeat ；

Object detection system overview

🚀 R-CNN 详解

自 CNN 于1990s 提出开始到 2012年 AlexNet 夺得 ILSVRC 2012 图像分类任务的冠军；
作者思考：如何将 图像分类 的性能泛化到 目标检测 任务上？
基于此提出了两个重点研究的问题：

（1）候选区域与CNN相结合（ Regions with CNN features ）；

（2）利用利用大数据集 (ILAVRC) 预训练模型，然后利用小数据集 (PASCAL) 进行候选区域的微调，解决训练数据稀疏的问题；

R-CNN 目标检测系统主要由三部分组成：

使用 选择性搜索（selective search ）来生成候选区域；

使用 AlexNet 对候选区域的特征进行提取；

将候选区域统一变换为 227×227 像素大小输入 AlexNet 网络；

特征矩阵通常为 2000×4096 ，SVM 权重矩阵为 4096×N，N为类别数；

VOC 2010 检测平均精度(%)

ILSVRC 2013 检测平均精度

文章出处登录后可见！

已经登录？立即刷新