NLP | 第4页 | AI技术聚合

ChatGPT模型大战：讯飞星火认知大模型、百度文心一言能否击败GPT-4（含个人内测体验测试邀请码获取方法，2小时申请成功，亲测有效）

目录前言讯飞星火内测申请申请方式内测体验登录界面百度内测申请内测对比基本问答事实性问答科普文写作小红书文案项目计划撰写古文理解模型的常识能力和反事实推理…

乘风

IT 2023年12月13日

9600

Llama模型结构解析（源码阅读）

目录 1. LlamaModel整体结构流程图 2. LlamaRMSNorm 3. LlamaMLP 4. LlamaRotaryEmbedding 参考资料： https://…

青葱年少

IT 2023年12月11日

8900

在英特尔做了一年 AI 研发，真的很香

大家好，我是对白。很多小伙伴都对外企的工作生活很好奇，包括工作内容、加班情况和公司福利等等，今天就给大家分享一位博主在Intel的工作经历，965的生活以及公司的人文关怀都很棒，…

xiaoxingxing

IT 2023年12月11日

3400

llama.cpp一种在本地CPU上部署的量化模型（超低配推理llama）

0x00 背景前不久，Meta前脚发布完开源大语言模型LLaMA，随后就被网友“泄漏”，直接放了一个磁力链接下载链接。然而那些手头没有顶级显卡的朋友们，就只能看看而已了但是…

青葱年少

IT 2023年12月8日

4200

一文带你UI界面玩转ChatGLM以及Llama的微调

Lora微调的概念： lora是Low-Rank Adaptation的缩写，是微软的Hu等人于2021年挂在ArXiv上（后又发表在ICLR2022上）的一篇论文…

乘风

IT 2023年12月7日

4200

LLaMA中ROPE位置编码实现源码解析

1、Attention中q，经下式，生成新的q。m为句长length，d为embedding_dim/head 2、LLaMA中RoPE源码 import torch def pr…

社会演员多

IT 2023年12月5日

4500

NLP词向量技术

什么是词向量：词向量（Word Vector）是对词语义或含义的数值向量表示，包括字面意义和隐含意义。词向量可以捕捉到词的内涵，将这些含义结合起来构成一个稠密的浮点数向量，这个…

心中带点小风骚

Python 2023年11月29日

4300

模型运行报 RuntimeError: CUDA out of memory. Tried to allocate 384.00 MiB (GPU 0； 31.75 GiB

最近在做一个多分类模型时，遇到一个下面bug，明明服务器多块GPU上有空闲GPU，却无法运行模型。 RuntimeError: CUDA out of memory. Tried …

扎眼的阳光

Python 2023年11月28日

4200

百度智能云正式上线Python SDK版本并全面开源！

文章目录 1. SDK的优势 2. 千帆SDK：快速落地LLM应用 3. 如何快速上手千帆SDK 3.1 SDK快速启动 3.2 SDK进阶指引 3.3 通过Langchain接入…

xiaoxingxing

Python 2023年11月13日

5800

国产AI大模型：智谱清言 vs. 文心一言

今年以来，国产AI大模型如雨后春笋般涌现，呈现出“百模齐出”的盛况。其中智谱清言在百模大战中脱颖而出。智谱清言基于智谱AI自主研发的中英双语对话模型ChatGLM2，通过万亿字符的…

扎眼的阳光

Python 2023年11月10日

25500