计算机视觉
-
清晰、幽默、轻松地深入理解YOLOv5网络结构和一些细节(查阅无数资料文献总结)
最近的一篇关于YOLOv5检测小目标博客的点击量很高,没想到YOLOv5在现在还是很有影响力的。既然这样,今天本人就本着幽默、清晰、轻松的风格带大家深入了解一下YOLOv5那倾倒众…
-
目标检测——梯度均衡机制GHM(Gradient Harmonized Mechanism)的理解
论文:Gradient Harmonized Single-stage Detector 论文地址:Gradient Harmonized Single-stage Detecto…
-
CVPR2022Mask Modeling在视频任务中也有效?复旦&微软提出Video版本BEVT,在多个视频数据集上SOTA!…
关注公众号,发现CV技术之美 本文分享 CVPR 2022 论文『BEVT: BERT Pretraining of Video Transformers』,复旦&微软提出…
-
数据增强中的仿射变换:旋转,缩放,平移以及错切(shear)
0. 引言 在深度学习(图像领域)中,为了提升训练样本数量数据增强是非常常见的手段。比如: 随机水平翻转 随机色调(H)、饱和度(S)、明度(V)调整 随机旋转,缩放,平移以及错切…
-
论文阅读笔记:ResNext
1. ResNext Xie, Saining, et al. “Aggregated residual transformations for deep neural netwo…
-
热力图生成算法及其具体实现
1. 概述 以前一直觉得热力图非常高大上,现在终于有机会研究并总结这个问题了。其实从图像处理的角度上来说,热力图生成算法并没有什么特别的,要得到非常漂亮的效果,数据以及配色方案的也…
-
卷积神经网络4——NiN
LeNet、AlexNet和VGG都有一个共同的设计模式:通过一系列的卷积层与汇聚层来提取空间结构特征;然后通过全连接层对特征的表征进行处理。 AlexNet和VGG对LeNet的…
-
UNet和传统CNN的区别
一、UNet网络模型 UNet有两部分组成:Encoder和Decoder组成。 1.Encoder UNet模型的左侧是Encoder模块,负责特征提取。由四个下采样块组成,每个…
-
机器视觉3:光度立体技术
(1)实验素材中提供了花瓶,球,莫扎特半身像的高度数据(vase.mat, mozart.mat, sphere.mat)。利用load命令将高度数据加载后,对高度数据求出梯度,并…
-
图像处理——基元检测和目标分割
目录 一、边缘检测 边缘检测与锐化强相关 1、检测原理 ①阶梯状边缘,②脉冲状边缘,③屋顶状边缘 ①阶梯状边缘,处于图像中两个具有不同灰度值的相邻区域之间 ②脉冲状边缘,它主要对应…