计算机视觉

清晰、幽默、轻松地深入理解YOLOv5网络结构和一些细节（查阅无数资料文献总结）

最近的一篇关于YOLOv5检测小目标博客的点击量很高，没想到YOLOv5在现在还是很有影响力的。既然这样，今天本人就本着幽默、清晰、轻松的风格带大家深入了解一下YOLOv5那倾倒众…

xiaoxingxing

技术文章 2022年5月23日

94800

技术文章

目标检测——梯度均衡机制GHM(Gradient Harmonized Mechanism)的理解

论文：Gradient Harmonized Single-stage Detector 论文地址：Gradient Harmonized Single-stage Detecto…

社会演员多

2022年5月23日

49900

CVPR2022Mask Modeling在视频任务中也有效？复旦&微软提出Video版本BEVT，在多个视频数据集上SOTA！…

关注公众号，发现CV技术之美本文分享 CVPR 2022 论文『BEVT: BERT Pretraining of Video Transformers』，复旦&微软提出…

xiaoxingxing

技术文章 2022年5月23日

58000

数据增强中的仿射变换：旋转，缩放，平移以及错切(shear)

0. 引言在深度学习（图像领域）中，为了提升训练样本数量数据增强是非常常见的手段。比如：随机水平翻转随机色调(H)、饱和度(S)、明度(V)调整随机旋转，缩放，平移以及错切…

心中带点小风骚

技术文章 2022年5月23日

1.8K00

论文阅读笔记：ResNext

1. ResNext Xie, Saining, et al. “Aggregated residual transformations for deep neural netwo…

社会演员多

技术文章 2022年5月23日

35300

热力图生成算法及其具体实现

1. 概述以前一直觉得热力图非常高大上，现在终于有机会研究并总结这个问题了。其实从图像处理的角度上来说，热力图生成算法并没有什么特别的，要得到非常漂亮的效果，数据以及配色方案的也…

心中带点小风骚

技术文章 2022年5月23日

64500

卷积神经网络4——NiN

LeNet、AlexNet和VGG都有一个共同的设计模式：通过一系列的卷积层与汇聚层来提取空间结构特征；然后通过全连接层对特征的表征进行处理。 AlexNet和VGG对LeNet的…

青葱年少

技术文章 2022年5月23日

40200

UNet和传统CNN的区别

一、UNet网络模型 UNet有两部分组成：Encoder和Decoder组成。 1.Encoder UNet模型的左侧是Encoder模块，负责特征提取。由四个下采样块组成，每个…

xiaoxingxing

技术文章 2022年5月23日

63400

机器视觉3：光度立体技术

（1）实验素材中提供了花瓶，球，莫扎特半身像的高度数据（vase.mat, mozart.mat, sphere.mat）。利用load命令将高度数据加载后，对高度数据求出梯度，并…

扎眼的阳光

技术文章 2022年5月23日

51301

图像处理——基元检测和目标分割

目录一、边缘检测边缘检测与锐化强相关 1、检测原理 ①阶梯状边缘，②脉冲状边缘，③屋顶状边缘 ①阶梯状边缘，处于图像中两个具有不同灰度值的相邻区域之间 ②脉冲状边缘，它主要对应…

社会演员多

技术文章 2022年5月23日

27700