在文心一言超越ChatGPT3.5后,我们做了大模型对比测试。

 

IDC发布的AI大模型评估报告中,文心一言拿下12个指标中的7个满分,综合评分第一。百度副总裁吴甜表示,新版文心一言已超越ChatGPT3.5。这是令人振奋的新闻。不过,我们还没能体验到文心一言。

除了文心一言,号称超过ChatGPT3.5大模型,还有google的bard,Meta的LlaMA2和claude2。我们来一一对比测试下。

将本文第一段,发给他们改写成震惊体。(点击图片,放大查看)

 google的bard

 

claude2

 

LlaMA2

 

ChatGPT3.5(ppword提供)

 

ChatGPT-4(ppword提供)

 

Llama2不能直接输出中文,后续要求输出中文,直接断开了。可能是第三方网站本身的问题。

可以看出,google的bard和claude2表现都非常不错。和chatGPT3.5确实接近了。体验过早期ChatGPT3.5的同学会知道,ChatGPT3.5之前也和bard和claude一样,废话很多。最近明显收敛了很多。

但是,他们所有人,都没法和ChatGPT-4相比。GPT-4是真的很强。我们尝试用GPT-4代替人工去各大内容平台(微信公众号,微博,小红书,知乎,bilibili等)发布内容。都获得非常不错的流量。把内容里明显的:‘虽然,但是,首先,其次’之类的固定格式去掉就可以了。

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
青葱年少的头像青葱年少普通用户
上一篇 2023年12月27日
下一篇 2023年12月27日

相关推荐