GPT-4介绍,论文链接

相关链接

openAI官网,点我 https://openai.com/
gpt1234、chatGPT都是他们做的,官网有很多资料,可以直接去这里找。
GPT-4官方介绍,点我 https://openai.com/product/gpt-4
GPT-4研究介绍,点我 https://openai.com/research/gpt-4

如何使用

开通chatGPT plus,大概一个月100多元
或者加入候补名单

gpt-4产品介绍

GPT-4 是 OpenAI 最先进的系统,可产生更安全、更有用的响应。GPT-4 可以更准确地解决难题,这要归功于其更广泛的常识和解决问题的能力。
这是 OpenAI 努力扩展深度学习的最新里程碑。GPT-4 是一个大型多模态模型(接受图像和文本输入,发出文本输出),虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平的表现。

创造力

GPT-4 比以往任何时候都更具创造性和协作性。它可以生成、编辑并与用户一起完成创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。
Input
Explain the plot of Cinderella in a sentence where each word has to begin with the next letter in the alphabet from A to Z, without repeating any letters.
Output
A beautiful Cinderella, dwelling eagerly, finally gains happiness; inspiring jealous kin, love magically nurtures opulent prince; quietly rescues, slipper triumphs, uniting very wondrously, xenial youth zealously.
输入
在句子中解释灰姑娘的情节,其中每个单词必须以字母表中从 A 到 Z 的下一个字母开头,不重复任何字母。
输出
美丽的灰姑娘,渴望安居,终于获得幸福;激起嫉妒的亲人,爱情神奇地孕育出富贵的王子;悄悄拯救,拖鞋胜利,团结无比,热心青年。

视觉输入

GPT-4 可以接受图像作为输入并生成说明、分类和分析。
输入
我可以用这些原料做什么?

输出
你可以用这些原料做很多选择!一些可能性包括: – 煎饼或华夫饼 – 可丽饼 – 法式吐司 – 煎蛋卷或菜肉馅煎蛋饼 – 乳蛋饼 – 奶油冻或布丁 – 蛋糕或纸杯蛋糕 – 松饼或面包 – 饼干或饼干 这些只是几个例子,但可能性是无穷无尽的!

输入:
这张图有什么好笑的?一个面板一个面板地描述它。

输出:
该图显示了带有三个面板的“Lightning Cable”适配器的包装。
面板 1:带有 VGA 连接器(一种大的蓝色 15 针连接器,通常用于计算机显示器)的智能手机已插入其充电端口。
面板 2:“Lightning Cable”适配器的包装,上面有 VGA 连接器的图片。
面板 3:VGA 连接器特写,末端有一个小型闪电连接器(用于为 iPhone 和其他 Apple 设备充电)。
这张图片中的幽默来自将过时的大型 VGA 连接器插入小型现代智能手机充电端口的荒谬做法。

更长的上下文

GPT-4 能够处理超过 25,000 个单词的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。
Input
[Text from: https://en.wikipedia.org/wiki/Rihanna]
Describe her Super Bowl performance and what made it special.
Output
Rihanna’s Super Bowl LVII halftime show performance was special for a number of reasons. For one, it marked her first live performance in over five years, and it was her first time headlining the Super Bowl halftime show. Additionally, she made history by becoming the first person to perform at the Super Bowl while pregnant. The show itself was critically acclaimed, with many praising her high-energy performance and impressive vocals. It also garnered a massive viewership, becoming the second most-watched halftime show in history.

GPT-4 的高级推理能力超越了 ChatGPT

ChatGPT
Input
Andrew is free from 11 am to 3 pm, Joanne is free from noon to 2 pm and then 3:30 pm to 5 pm. Hannah is available at noon for half an hour, and then 4 pm to 6 pm. What are some options for start times for a 30 minute meeting for Andrew, Hannah, and Joanne?
Output
Here is a list of their availability:

  • Andrew: 11 am to 3 pm
  • Joanne: noon to 2 pm, and 3:30 pm to 5 pm
  • Hannah: noon to 12:30 pm, and 4 pm to 6 pm
    Based on their availability, there is a 30-minute window where all three of them are available, which is from 4 pm to 4:30 pm. So, the meeting can be scheduled at 4 pm.

GPT-4
Input
Andrew is free from 11 am to 3 pm, Joanne is free from noon to 2 pm and then 3:30 pm to 5 pm. Hannah is available at noon for half an hour, and then 4 pm to 6 pm. What are some options for start times for a 30 minute meeting for Andrew, Hannah, and Joanne?
Output
Andrew: 11 am – 3 pm
Joanne: 12 pm – 2 pm, 3:30 pm – 5 pm
Hannah: 12 pm – 12:30 pm, 4 pm – 6 pm
Common availability for a 30-minute meeting: 12 pm – 12:30 pm

GPT-4 比ChatGPT在专业考试中获得了更高分数

统一律师考试:
ChatGPT 10分
GPT-4 90分
生物奥林匹克:
ChatGPT 31分
GPT-4 99分

考试、模型、得分ChatGPTGPT-4
统一律师考试1090
生物奥林匹克3199

GPT-4落地产品

GPT-4 加深了 Duolingo 上的对话

Be My Eyes使用 GPT-4 来改变视觉可访问性

Stripe 利用 GPT-4 来简化用户体验并打击欺诈。

摩根士丹利财富管理部署 GPT-4 来组织其庞大的知识库

冰岛使用 GPT-4 来保护其语言

可汗学院在有限的试点项目中探索 GPT-4 的潜力

训练过程

与以前的 GPT 模型一样,GPT-4 基础模型经过训练可以预测文档中的下一个单词,并且使用公开可用的数据(例如互联网数据)以及我们已获得许可的数据进行训练。这些数据是网络规模的数据语料库,包括数学问题的正确和错误解决方案、弱推理和强推理、自相矛盾和一致的陈述,并代表各种各样的意识形态和想法。

因此,当出现问题提示时,基本模型可以以多种可能与用户意图相去甚远的方式做出响应。为了使其与护栏内的用户意图保持一致,我们使用强化学习和人工反馈 ( RLHF )来微调模型的行为。

请注意,该模型的能力似乎主要来自预训练过程——RLHF 不会提高考试成绩(如果不积极努力,它实际上会降低考试成绩)。但是模型的控制来自训练后过程——基础模型需要及时的工程设计甚至知道它应该回答问题。

限制

尽管功能强大,但 GPT-4 与早期的 GPT 模型具有相似的局限性。最重要的是,它仍然不完全可靠(它“幻觉”事实并出现推理错误)。在使用语言模型输出时应格外小心,特别是在高风险上下文中,使用与特定用例的需求相匹配的确切协议(例如人工审查、附加上下文的基础或完全避免高风险使用) .
虽然仍然是一个真正的问题,但 GPT-4 相对于以前的模型(它们本身在每次迭代中都在改进)显着减少了幻觉。在我们的内部对抗性真实性评估中,GPT-4 的得分比我们最新的 GPT-3.5 高 40%:

更多信息

研究:GPT-4 是 OpenAI 努力扩展深度学习的最新里程碑。查看 GPT-4 研究
基础设施:GPT-4 在 Microsoft Azure AI 超级计算机上接受过训练。Azure 的 AI 优化基础架构还使我们能够向世界各地的用户提供 GPT-4。
限制:GPT-4 仍然有许多我们正在努力解决的已知局限性,例如社会偏见、幻觉和对抗性提示。随着社会采用这些模型,我们鼓励并促进透明度、用户教育和更广泛的人工智能素养。我们还旨在扩大人们在塑造我们的模型时的输入途径。
可用性:GPT-4 在 ChatGPT Plus 上可用,并作为开发人员构建应用程序和服务的 API。
我们很高兴看到人们如何使用 GPT-4,因为我们致力于开发赋予每个人权力的技术。

结论

我们期待 GPT-4 成为一个有价值的工具,通过为许多应用程序提供动力来改善人们的生活。还有很多工作要做,我们期待通过社区在该模型之上构建、探索和贡献的集体努力来改进该模型。

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
社会演员多的头像社会演员多普通用户
上一篇 2023年4月5日
下一篇 2023年4月5日

相关推荐