计算机视觉
-
BiFPN 论文重点研读:高效双向跨尺度连接和加权特征融合
这是今天读的第二篇论文,EfficientDet: Scalable and Efficient Object Detection。论文地址以引用方式出现,听起来好像挺酷,其实大家…
-
【计算机视觉 | 目标检测】术语理解2:Grounding 任务、MLM、ITM代理任务
文章目录 一、Grounding 任务 二、word-region 级别的 grounding 任务 三、MLM、ITM代理任务 一、Grounding 任务 Grounding …
-
计算机视觉:分割一切AI大模型segment-anything
1 segment-anything介绍 Segment Anything Model (SAM)来源于Facebook公司Meta AI实验室。据Mata实验室介绍,SAM 已经…
-
CV 经典主干网络 (Backbone) 系列: CSP-Darknet53
CSP-Darknet53 0. 引言 1. 网络结构图 1.1 输入部分 1.2 CSP部分结构 1.3 输出部分 2. 代码实现 2.1 代码整体实现 2.2 代码各个阶段实现…
-
torchvision.models简介
torchvision.models简介 1 torchvision.models介绍 1.1 torchvision介绍 1.2 torchvision.models 2 导入模…
-
yolov5识别cf火线敌人(FPS类的AI瞄准)详细教程二
一.前言 上篇文章已经写了yolov5的基础用法,这篇文章主要是将我对yolov5模型的修改,用于实现对屏幕进行实时监测识别并将鼠标移动到人体指定位置的功能,改动的代码不是很多,我…
-
用手势操控现实:OpenCV 音量控制与 AI 换脸技术解析
基于opencv的手势控制音量和ai换脸 HandTrackingModule.py import cv2 import mediapipe as mp import time c…
-
【计算机视觉】COCO Caption数据集简单介绍
最近在做开放域目标检测时候,经常遇到一个数据集—COCO Caption数据集。 这里就来介绍一下数据集。 COCO Caption数据集: Microsoft COCO Capt…
-
Swin-Transformer 实战代码与讲解(快速上手)
Swin-Transformer学习笔记(适合小白) 1、项目源码以及主要参考 2、Swin-Transformer介绍 3、模型的构成 3.1 Patch Partition 3…
-
(论文加源码)基于deap数据集的transformer结合注意力机制脑电情绪识别
本篇论文是2021年新发表的一篇论文。也是目前有源码的论文中唯一一篇使用transformer模型和注意力机制的论文源码(pytorch和tensorflow版本均有) 论文及源码…