计算机视觉
-
Darknet53网络结构复现(Pytorch版)
Yolov3主干网络Darknet53网络结构复现,非常基础的写法,比较适合新手 from torch import nn from torch.nn import functio…
-
【云计算实验】基于OpenMP、CUDA、OpenCL、GPU并行计算实验
前言 本文是之前做云计算实验整理的内容,借博客保存一下! 使用不同方法对算法加速还是很有意思的! 实验题目 自选一张图片,按照实验指南说明在jetson05节点上基于OpenMP和…
-
Layout系列模型(LayoutLM,LayoutLMv2,LayoutXLM)
LAYOUT LM 联合建模文档的layout信息和text信息,预训练文档理解模型。 模型架构 使用BERT作为backbone,加入2-D绝对位置信息,图像信息,分别捕获tok…
-
EfficientNetV1结构讲解
1.论文地址 https://arxiv.org/abs/1905.11946 2.卷积神经网络发展历程 在AlexNet横空出世之后,卷积神经网络被大量应用于深度学习深度学习的研…
-
CVPR2018/语义分割/UDA:Learning from Synthetic Data: Addressing Domain Shift for Semantic Segmentation
论文地址 代码地址 0.摘要 视觉域适应是计算机视觉中的一个重要问题。以前的方法表明,即使是深度神经网络也无法跨域转移学习信息表示。在获取手工标记数据极其困难和乏味的任务中,这个问…
-
时序动作定位 | I3D(Inflated 3D ConvNet) 与 UNT(UntrimmedNets) 特征模型
目录 UNT(UntrimmedNets) 论文地址:https://openaccess.thecvf.com/content_cvpr_2017/papers/Wang_Un…
-
基于时空融合的高效率多阶段视频降噪方法-EMVD
1. 介绍 这是Huawei Noah‘s Ark Lab在CVPR2021上的文章。他们针对于终端设备算力有限的条件下,提出了一种有效的视频降噪算法EMVD,其主要特点在于 通过…
-
OPENCV图像直方图以及均值化
直方图是我们在照片中使用来查看图像中每个值有多少像素,照片中的每个像素的值都从0(黑色)到255(白色),图的左侧代表音阶的暗色调,右侧代表较亮的色调。在彩色摄影中,每个像素对于每…
-
【目标检测】YOLOv1:You Only Look Once
前言 YOLO系列目标检测算法是卷积神经网络中的一阶段检测算法,是基于深度学习的端到端的回归方法。 YOLO官网:https://github.com/pjreddie/darkn…
-
何凯明最新一作MAE解读系列2之代码实践
前言 github:https://github.com/facebookresearch/mae 论文:https://arxiv.org/abs/2111.06377 解读:何…