计算机视觉

predict模式用于在新图像或视频上使用经过训练的YOLOv8模型进行预测，在此模式下，模型从checkpoint 文件加载，用户可以提供图像或视频来执行推理。模型预测输入图像或…

Python 2023年5月31日

76200

CityScapes Cityperson数据集，在16年CVPR上被提出，是张姗姗一波人在CityScapes数据集上进行标注得到的行人检测数据集。做行人检测的应该都不陌生。在R…

Python 2023年5月30日

21600

【论文精读】 SadTalker：Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Singl…

Python 2023年5月30日

26900

目录第1章绪论 1 1.1研究背景与意义 1 1.2课题研究现状 1 1.3研究目标 1 1.4研究内容与论文组织结构 1 第2章相关理论与关键技术 3 2.1计算机视觉概述…

Python 2023年5月30日

12200

源码地址原教程在这里演示效果：（有点虚）利用Python程序生成字符画让男大学生们洗脑的挖呀挖呀挖使用教程（源码在文章最后）打开pyhton编译器安装opencv和Pi…

Python 2023年5月29日

12700

最近Meta AI发布了Segment Anything模型，可以直接分割任何图片。我趁热乎体验了一下。文章目录进入官网 & 上传图片 Hover & Clic…

Python 2023年5月29日

14600

文章目录摘要解决问题算法模型结构通过frozen图像编码器学习视觉语言表征图像文本对比学习（ITC）基于图像文本生成（ITG）图文匹配（ITM）从大规模语言模型学…

Python 2023年5月29日

37400

图像分割是指将一幅图像划分成多个子区域或像素集合的过程，其中每个子区域或像素集合具有一定的统计特征或语义信息。图像分割是图像处理中的基础任务，其应用涵盖了医学影像、计算机视觉、机器…

Python 2023年5月29日

13300

前言一、视觉-语言模型是什么？二、视觉-语言模型可以用来做什么？三、视觉-语言预训练模型 3.1、模型架构 3.2、训练目标 3.2.1、图像-文本匹配损失（ITM） 3.…

Python 2023年5月29日

15300