transformer

ChatGPT系列学习（1）transformer基本原理讲解

文章目录 1. 简介 1.1. 发展史 2. Transformer 整体结构 3. 名词解释 3.1. token 4. transformer输入 4.1. 单词 Embedd…

青葱年少

Python 2023年6月17日

11200

BEV感知：BEV开山之作LSS（lift,splat,shoot）原理代码串讲

自动驾驶：BEV开山之作LSS（lift,splat,shoot）原理代码串讲前言 Lift 参数创建视锥 CamEncode Splat 转换视锥坐标系 Voxel Pool…

乘风

Python 2023年6月12日

16000

[自注意力神经网络]Segment Anything(SAM)论文阅读

论文地址https://arxiv.org/abs/2304.02643源码地址https://github.com/facebookresearch/segment-anythi…

xiaoxingxing

Python 2023年6月12日

17200

涨点技巧：注意力机制—Yolov5/Yolov7引入BoTNet Transformer、MHSA

1. BoTNet（Bottleneck Transformer Network） UC伯克利，谷歌研究院(Ashish Vaswani, 大名鼎鼎的Transformer一作） …

扎眼的阳光

Python 2023年5月29日

13400

Transformer中的Q/K/V理解

输入句子序列：我爱吃酸菜鱼上图为输入矩阵，每个token的维度为768维，则矩阵维度为Lx768。第一步：通过乘以线性变化矩阵（维度为768×768），得到矩阵Q，K…

青葱年少

Python 2023年5月29日

7700

[多图，秒懂]如何训练一个“万亿大模型”？

1. 背景近几年，随着“大模型”概念的提出，深度学习模型越来越大，如何训练这些大模型成为一个亟待解决的工程问题。最初的视觉模型只有几百兆的参数量，而现在的语言模型中，动则百亿，千…

扎眼的阳光

Python 2023年5月27日

39700

Python安装torch，transformers库

Python安装torch，transformers库前言安装torch库安装transformers库前言最近由于竞赛需要安装Python中机器学习torch已经tra…

xiaoxingxing

Python 2023年5月27日

36900

LangChain：Prompt Templates介绍及应用

❤️觉得内容不错的话，欢迎点赞收藏加关注😊😊😊，后续会继续输入更多优质内容❤️👉有问题欢迎大家加关注私戳或者评论（包括但不限于NLP算法相关，linux学习相关，读研读博相关&#8…

青葱年少

Python 2023年5月19日

38000

【轴承RUL预测代码】基于TCN、TCN和多头注意力(TCN和Transformer的encoder结合)、Transformer模型的轴承RUL预测代码(精华)

近期新写的PHM2012&XJTU轴承寿命预测完整代码原始特征集(①原始振动信号序列数据②FFT预处理序列数据③STFT预处理序列数据④HHT边际谱序列数据) 模型(①T…

乘风

Python 2023年5月18日

12900

ChatGPT开源平替——OpenChatKit（前OpenAI团队打造）

❤️觉得内容不错的话，欢迎点赞收藏加关注😊😊😊，后续会继续输入更多优质内容❤️👉有问题欢迎大家加关注私戳或者评论（包括但不限于NLP算法相关，linux学习相关，读研读博相关&#8…

心中带点小风骚

Python 2023年4月20日

11200