计算机视觉
-
【目标检测】YOLOV8实战入门(五)模型预测
predict模式用于在新图像或视频上使用经过训练的YOLOv8模型进行预测,在此模式下,模型从checkpoint 文件加载,用户可以提供图像或视频来执行推理。模型预测输入图像或…
-
CityScapes数据集介绍
CityScapes Cityperson数据集,在16年CVPR上被提出,是张姗姗一波人在CityScapes数据集上进行标注得到的行人检测数据集。做行人检测的应该都不陌生。在R…
-
【论文精读】 SadTalker:Stylized Audio-Driven Single Image Talking Face Animation(CVPR2023)
【论文精读】 SadTalker:Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Singl…
-
基于Python的车牌识别系统的实现
目录 第1章 绪论 1 1.1研究背景与意义 1 1.2课题研究现状 1 1.3研究目标 1 1.4研究内容与论文组织结构 1 第2章 相关理论与关键技术 3 2.1计算机视觉概述…
-
利用Python程序生成字符画 让男大学生们洗脑的挖呀挖呀挖
源码地址 原教程在这里 演示效果:(有点虚) 利用Python程序生成字符画 让男大学生们洗脑的挖呀挖呀挖 使用教程(源码在文章最后) 打开pyhton编译器安装opencv和Pi…
-
推荐10大Midjourney关键词网站,让你Ai创作如虎添翼!
为了让大家提高工作效率,本期将给大家推荐一些灵活高效Midjourney关键词网站,这样各位就可以直接参考别人的AI关键词进行创作了,听起来是不是很棒棒啊!其实当AI盛行后,网上A…
-
Meta AI Segment Anything Model (SAM)初体验
最近Meta AI发布了Segment Anything模型,可以直接分割任何图片。我趁热乎体验了一下。 文章目录 进入官网 & 上传图片 Hover & Clic…
-
BLIP2-图像文本预训练论文解读
文章目录 摘要 解决问题 算法 模型结构 通过frozen图像编码器学习视觉语言表征 图像文本对比学习(ITC) 基于图像文本生成(ITG) 图文匹配(ITM) 从大规模语言模型学…
-
图像分割的常用算法
图像分割是指将一幅图像划分成多个子区域或像素集合的过程,其中每个子区域或像素集合具有一定的统计特征或语义信息。图像分割是图像处理中的基础任务,其应用涵盖了医学影像、计算机视觉、机器…
-
CCIG 2023 从视觉-语言模型到智能文档图像处理
前言 一、视觉-语言模型是什么? 二、视觉-语言模型可以用来做什么? 三、视觉-语言 预训练模型 3.1、模型架构 3.2、训练目标 3.2.1、图像-文本匹配损失(ITM) 3.…