计算机视觉
-
从传统的图像压缩到基于深度学习的图像压缩
传统图像压缩 简述 早期的图像压缩方法直接利用熵编码减少图像的编码冗余来实现压缩,例如,霍夫曼(Huffman)编码,算术编码,上下文自适应二进制算术编码。 在20世纪 60年代后…
-
摄影入门 | 相机的基本原理
一、获取图像——小孔成像实验 小孔成像实验中,点燃蜡烛,会在小孔另一面的白纸上看到一个倒立的烛焰。 此现象可以用来解释物理学原理:光在同种均匀介质中,在不受引力作用干扰的情况下沿直…
-
深度学习——卷积层的输入输出多通道(笔记)+代码
一 输入通道 1.多个输入通道 ①彩色图像有RGB(红绿蓝组成)三个通道 ②转换为灰度会丢失信息 灰度一个通道 2.多个通道输出的结果:只有一个输出 每个通道都有对应的卷积核,输出…
-
YOLOv5训练过程中遇到该问题的解决方法ValueError: The requested array has an inhomogeneous shape after 1 dimensions
YOLOv5训练时遇到问题ValueError: setting an array element with a sequence. The requested array has…
-
3 个令人惊艳的 AI 项目,开源了!
公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 过去一周,从外界看,AI 貌似放缓了进步速度,但只有身处其中的人才能知道,AI 一直没有停下进化…
-
Yolov8改进—注意力机制: SimAM(无参Attention)和NAM(基于标准化的注意力模块),效果秒杀CBAM、SE
🏆🏆🏆🏆🏆🏆Yolov8魔术师🏆🏆🏆🏆🏆🏆 ✨✨✨魔改网络、复现前沿论文,组合优化创新 🚀🚀🚀小目标、遮挡物、难样本性能提升 🍉🍉🍉定期更新不同数据集涨点情况 1. SimAM:无…
-
AI视觉算法训练平台介绍
AI视觉算法训练平台是一种用于训练图像识别、目标检测和语义分割等任务的软件平台。本文将对这类平台进行介绍,并简要说明其设计原理和使用方法。 首先,AI视觉算法训练平台通常由图像处理…
-
图像描述生成(image caption)
之前做毕业设计时,苦于没有高质量的图文数据对,了解到可以由图片生成文本,但也就体验了下模型效果,并没有进行这方面的学习,现在借此机会了解了解。 前言 image caption的目…
-
MotionBERT:Unified Pretraining for Human Motion Analysis中文翻译
声明:笔者翻译论文仅为学习研究,如有侵权请联系作者删除博文,谢谢! 源论文地址:[2210.06551] MotionBERT: Unified Pretraining for H…
-
YOLOv5区域入侵检测【附完整代码以及视频演示】
一、前期准备: 首先你需要有一份yolov5的官方源码,并且能够找到其中的detect.py文件即可。 在检测过程中,有些项目不需要我们检测所有的区域,比如禁止区域的入侵检测,只需…