自然语言处理
-
【深度学习】——Informer模型
Informer模型是一种用于时间序列预测的深度学习模型,由中国科学院自动化研究所的研究团队提出。与传统的RNN、LSTM、GRU等模型不同,Informer模型采用了一种新的注意…
-
大语言模型(LLM)分布式训练框架总结
©PaperWeekly 原创 · 作者 | 避暑山庄梁朝伟 背景 随着 ChatGPT 的火爆出圈,大模型也逐渐受到越来越多研究者的关注。有一份来自 OpenAI 的研究报告 (…
-
Visual Prompt
始于NLP 简单来讲,Prompt就是对原来的输入文本进行一定的处理,使得在不改变预训练模型参数的情况下,相应任务的性能变高。例如,原输入文本为:I received the of…
-
ChatGPT将会成为强者的外挂?—— 提高学习能力
目录 🧑💻 ❗ 🌟 前言 在上篇我已讲述如何提问、分析问题以及如何提问才能获取更高质量的答案,这是关键。那么学习能力可以说是提问能力的基础,因为学习能力培养…
-
英伟达A100/1800/H100是CHATGPT最佳选择了吗
人工智能最新成果CHATGPT惊艳出师,国内大厂代表百度也在奋起直追,如果说之前的科技产品解放了人的四肢,那么接下来的人的大脑被替代也是必然,是否就意味着人类失去了生存的优势及意义…
-
人工智能领域:面试常见问题超全(深度学习基础、卷积模型、对抗神经网络、预训练模型、计算机视觉、自然语言处理、推荐系统、模型压缩、强化学习、元学习)
【深度学习入门到进阶】必看系列,含激活函数、优化策略、损失函数、模型调优、归一化算法、卷积模型、序列模型、预训练模型、对抗神经网络等 专栏详细介绍:【深度学习入门到进阶】必看系列,…
-
python pytorch教程-带你从入门到实战(代码全部可运行)
python pytorch教程-带你从入门到实战(代码全部可运行) 其实这个教程以前博主写过一次,不过,这回再写一次,打算内容写的多一点,由浅入深,然后加入一些实践案例。 下面是…
-
Word2Vec详解
Word2Vec 基本思想:通过训练将每一个词映射成一个固定长度的向量,所有向量构成一个词向量空间,每一个向量(单词)可以看作是向量空间中的一个点,意思越相近的单词距离越近。 如何…
-
一款支持AI思维导图的AI助手——ChatMindAI
写在前面 Hello大家好, 我是【麟-小白】,一位软件工程专业的学生,喜好计算机知识。希望大家能够一起学习进步呀!本人是一名在读大学生,专业水平有限,如发现错误或…
-
Transformer [全网最详细的Transformer讲解]
Transformer 1. Transformer的结构 先看 Transformer 的整体框架: 可能看起来很复杂,但其实还是 Encoder 和 Decoder {seq2…