计算机视觉
-
经典/最新计算机视觉论文及代码推荐
今日推荐几篇最新计算机视觉方向的论文,涉及诸多方面,具体内容详见论文原文和代码链接。 文本到图像生成 论文题目:Zero-Shot Text-to-Image Generation…
-
Concat和add操作
1、Concat:张量拼接,会扩充两个张量的维度,2、add:张量相加,张量直接相加,不会扩充维度。 一般情况下,feature maps的结合有两种方法,一种是元素对应相加,简称…
-
YoloV1复现:依靠kaggle平台复现YoloV1的笔记(主要讲解代码实现)
前言: 笔者发现csdn上关于从头到尾逐个模块复现yolov1的代码资源较少,大多只谈论yolov1的思想,而新入手的小白(比如笔者)很多代码细节并不明白,也不知道从那里找到资源学…
-
三维重建系统 | L3双视角运动恢复结构(SFM双目SFM)
一、三角量测 定义:给定图像匹配点和相机参数恢复匹配点三维坐标的问题 。 由上图所示,由三维点坐标和一个相机内外参数可以确定一条射线,可能的目标三维点就在这条射线上,所以至少需要两…
-
[多目标跟踪学习笔记]光流法
光流法是进行目标跟踪的传统方法, 参照视频B站进行学习, 做的笔记. 1. 运动场(Motion Field)与光流(Optical Flow) 光流, 顾名思义就是光的流动. 对…
-
李沐动手学深度学习V2-全卷积网络FCN和代码实现
一.全卷积网络FCN 1. 介绍 语义分割是对图像中的每个像素分类,全卷积网络(fully convolutional network,FCN)采用卷积神经网络实现了从图像像素到像…
-
ConVIRT论文详解(医疗图片)
ConVIRT论文详解(医疗图片) – 潘登同学的深度学习笔记 前言 ConVIRT全称是(contrastive learning of medical visual repre…
-
(Opencv①)图像基本知识
1.图像格式 ①BMP格式:Windows系统下最标准的图像格式,未经过压缩,一般图像文件较大。 ②JPEG格式:应用最广泛的图像格式,一般采用有损压缩算法。 ③GIF格式:可以是…
-
热力图回归Adaptive Wing Loss [ICCV2019] 论文阅读
paper: Adaptive_Wing_Loss_ICCV 2019 code: https://github.com/protossw512/AdaptiveWingLoss …
-
NVIDIA GPU编程系列课程(CUDA编程)
NVIDIA网站有一部分GPU编程系列的课程,具体的课程地址为: https://www.nvidia.cn/developer/online-training/community…