计算机视觉
-
yolov5识别cf火线敌人(FPS类的AI瞄准)详细教程一
一. 前言 因为自己的研究方向也是深度学习方向,而且平时闲的时候还喜欢玩会cf火线等枪战游戏,就想着找一个大模型做一个对游戏敌人的识别的功能,一切实现之后就想把自己的心得写出来,我…
-
Camera-IMU联合标定原理
Camera-IMU联合标定原理 一.相机投影模型 二.IMU 模型 三.Camera-IMU标定模型 (一) 相机-IMU旋转 (二) 相机-IMU平移 (三) 视觉惯性代价函数…
-
[深度学习] 基于切片辅助超推理库SAHI优化小目标识别
对象检测是迄今为止计算机视觉中最重要的应用领域。然而,小物体的检测和大图像的推理仍然是实际使用中的主要问题,这是因为小目标物体有效特征少,覆盖范围少。小目标物体的定义通常有两种方式…
-
多模态分析数据集(Multimodal Dataset)整理
这里整理一下平时所用的多模态数据集以备之用,主要分为 多模态分类(情感分类,影视分类) 多模态问答 多模态匹配(检索) 多模态生成 后面会不断地去添加,也希望能够帮到其他人,欢迎大…
-
常见图像噪声和常见图像噪声处理算法
1、图像噪声 1.1图像噪声的分类 图像噪声按噪声与信号的关系可分为加性噪声和乘性噪声;按照产生原因可分为外部噪声和内部噪声;按照统计特性可分为平稳噪声和非平稳噪声;平稳噪声基于统…
-
Diffusion Model原理详解
Diffusion Model(扩散模型 )对标的是生成对抗网络(GAN),只要GAN能干的事它基本都能干。之前用GAN网络来实现一些图片生成任务其实效果并不是很理想,而且往往训练…
-
VideoPose3D:基于视频的3D人体关键点检测
1. 概述 Dario Pavllo等人于2019年提出了VideoPose3D模型,旨在把输入视频转换成人体各关键点相对于根关节的相对三维位置。为了实现这一目的,作者采取的是两步…
-
anaconda3:conda not found问题
文章仅仅针对ubuntu系统下,本人设备产生的conda not found问题进行分享。 注: 1)、系统ubuntu 20.04 LTS,英伟达3090 GPU,CUDA==1…
-
opencv 判断点在多边形内外
基于Python 和 OpenCV 画出多边形,以及判断某个点是不是在多边形内。 1、cv2.pointPolygonTest() 函数 函数定义:…
-
图-文多模态,大模型,预训练
参考老师的无敌课程 多模态任务是指需要同时处理两种或多种不同类型的数据(如图像、文本、音频等)的任务。例如,图像描述(image captioning)就是一种典型的多模态任务,它…