transformer

LLaMA-2 下载&demo使用

LLaMA-2 下载&demo使用 1. LLaMA-2 下载&demo使用 1.1 meta官网 1.2 huggingface 1.3 其他源 1.4 hugg…

乘风
IT 1天前
100
RT-DETR论文阅读笔记（包括YOLO版本训练和官方版本训练）

论文地址：RT-DETR论文地址代码地址：RT-DETR官方下载地址大家如果想看更详细训练、推理、部署、验证等教程可以看我的另一篇博客里面有更详细的介绍内容回顾：详解RT-D…

青葱年少
IT 2024年4月16日
3100
白话transformer（二）：Q K V矩阵

前面说了注意力机制的工作原理，本次来看看为了实现自注意力机制，Q K V矩阵是如何实现的。 B站视频白话transformer（二） 1、语义相似性我们在前面说了，embedd…

青葱年少
IT 2024年4月16日
2000
【论文笔记】Mamba：挑战Transformer地位的新架构

Mamba Mamba: Linear-Time Sequence Modeling with Selective State Spaces Mamba Mamba 摘要背景存…

社会演员多
IT 2024年4月16日
3700
【Transformer系列（1）】encoder（编码器）和decoder（解码器）

前言这个专栏我们开始学习transformer，自推出以来transformer在深度学习中占有重要地位，不仅在NLP领域，在CV领域中也被广泛应用，尤其是2021年，trans…

青葱年少
技术文章 2024年4月10日
4000
Python 基于pytorch实现多头自注意力机制代码；Multiheads-Self-Attention代码实现

1.Multiheads-Self-Attentiona简介多头自注意力机制（Multi-Head Self-Attention）是一种注意力机制的变体，用于增强模型在处理序列数…

xiaoxingxing
Python 2024年4月10日
1800
【论文阅读】Transformer 论文逐段精读

Transformer 论文逐段精读【论文精读】文章目录 Transformer 论文逐段精读【论文精读】 📝摘要 📜结论 📌引言 ⏱️相关工作 ⭐模型 Overview 3.1…

青葱年少
IT 2024年4月10日
3200
Transformer + SD解析与实战——Datawhale AI视频生成学习2

Transformer + SD解析与实战——Datawhale AI视频生成学习2 文章目录 Transformer + SD解析与实战——Datawhale AI视频生成学习2…

乘风
技术文章 2024年4月10日
2100
一文通透想颠覆Transformer的Mamba：从SSM、HiPPO、S4到Mamba

前言不知读者发现没有，本文标题的信息含量很大，比如出来了一个新的序列模型：Mamba，其基于SSM或S4发展为S6(S4 models with a selection mec…

心中带点小风骚
技术文章 2024年4月10日
5200
Transformer模型：人工智能技术发展的里程碑

在当今人工智能领域，Transformer模型已经成为了一种划时代的技术，它不仅在自然语言处理（NLP）领域取得了突破性的进展，也为其他机器学习任务提供了新的思路和方法。我们今天将…

xiaoxingxing
技术文章 2024年4月10日
1800

1 / 26
1
2
3
4
5
6
下一页