按时间归档:2022年05月
-
centos7.6 编译opencv和ffmpeg源码
一、准备工作: CentOS-7-x86_64-DVD-1810(7.6版本) ffmpeg-4.2.4.tar.xz 源码 opencv-4.5.5.zip 源码 以上三个库自己…
-
Layout系列模型(LayoutLM,LayoutLMv2,LayoutXLM)
LAYOUT LM 联合建模文档的layout信息和text信息,预训练文档理解模型。 模型架构 使用BERT作为backbone,加入2-D绝对位置信息,图像信息,分别捕获tok…
-
EfficientNetV1结构讲解
1.论文地址 https://arxiv.org/abs/1905.11946 2.卷积神经网络发展历程 在AlexNet横空出世之后,卷积神经网络被大量应用于深度学习深度学习的研…
-
【基于Pytorch实现Transformers机器翻译】
本文主要介绍了基于Pytorch来实现Transformers机器翻译 Transformer的总体架构 WordEmbedding(词嵌入) 词嵌入的实现 class Token…
-
CVPR2018/语义分割/UDA:Learning from Synthetic Data: Addressing Domain Shift for Semantic Segmentation
论文地址 代码地址 0.摘要 视觉域适应是计算机视觉中的一个重要问题。以前的方法表明,即使是深度神经网络也无法跨域转移学习信息表示。在获取手工标记数据极其困难和乏味的任务中,这个问…
-
目标检测-自动驾驶
1 简介 有前视图、后视图、周视图、环视图等概念 2 End-to-End Trainable One-Stage Parking Slot Detection Integrati…
-
时序动作定位 | I3D(Inflated 3D ConvNet) 与 UNT(UntrimmedNets) 特征模型
目录 UNT(UntrimmedNets) 论文地址:https://openaccess.thecvf.com/content_cvpr_2017/papers/Wang_Un…
-
基于 树莓派4 + STM32H7 构建支持云端应用的嵌入式系统平台 【一】
原创不易,转载请注明出处,互相尊重劳动成果,谢谢! 一. 想法概述 1. 想法由来 从事嵌入式软件开发多年,涉及许多不同产品需求与应用场景,其间使用了多种不同的软硬件系统与平台,系…
-
python(5):TypeError: xxx() got an unexpected keyword argument ‘xxx‘
定义了一个python函数,调用时出现报错如下: Traceback (most recent call last): File “gaussian_kernel.py”, lin…
-
基于时空融合的高效率多阶段视频降噪方法-EMVD
1. 介绍 这是Huawei Noah‘s Ark Lab在CVPR2021上的文章。他们针对于终端设备算力有限的条件下,提出了一种有效的视频降噪算法EMVD,其主要特点在于 通过…