ChatGPT、New Bing、文心一言、通义千问等 AI 工具到底哪个更AI? – 第二期

文章目录

  • 前言
  • 选手介绍
    • ChatGPT
    • New Bing
    • 文心一言
    • 钉钉的文档AI
    • 通义千问
    • 文心一格
    • 通义万相
  • 测试开始
    • 文案编写
      • ChatGPT
      • New Bing
      • 文心一言
      • 钉钉的文档AI
      • 通义千问
    • 代码解读
      • ChatGPT
      • New Bing
      • 文心一言
      • 钉钉的文档AI
      • 通义千问
    • 代码编写
      • ChatGPT
      • New Bing
      • 文心一言
      • 钉钉的文档AI
      • 通义千问
    • 英语翻译
      • ChatGPT
      • New Bing
      • 文心一言
      • 钉钉的文档AI
      • 通义千问
    • 时政热点态度
      • ChatGPT
      • New Bing
      • 文心一言
      • 钉钉的文档AI
      • 通义千问
    • AI绘图
      • ChatGPT
      • New Bing
      • 钉钉的文档AI
      • 文心一格
      • 通义万相
    • 热词解释
      • ChatGPT
      • New Bing
      • 文心一言
      • 钉钉的文档AI
      • 通义千问
  • 总结

前言

本次是上次文章的后续,经历了这么久的时间,我也是在几个月前拿到了通义千问的测试资格,本次参加的选手是:ChatGPT、New Bing、文心一言、通义千问、钉钉的文档AI,本次还带来了两个额外的嘉宾:【文心一格、通义万相】,让我们一起期待本次测试的结果吧!

本次的测试和以往不同,这次从这几个角度出发对以上的 AI 工具进行测试:【文案编写,代码解读,代码编写,英语翻译,时政热点态度,AI绘图,热词解释】,让我们一起进入本次的欢乐时光,预计本文最晚在本周日(2023/09/17)完成。

当然,有什么更好的测试方向可以在评论区讨论,我会尽力的尝试的!

选手介绍

ChatGPT

成名的以为成员,想必无需过多的介绍,它是 Oppenai 的作品,在几个月前掀起了 AI 的热潮,本次使用的是 ChatGPT 版本,不是 GPT4.0,至于两者的区别,可以参考一下文章开头提前的前传。

New Bing

微软的 AI 大模型语言工具,是基于 Bing 的升级版本,现在的大火 AI 模型之一。

文心一言

百度的 AI 作品,国内首先一批发布的工具,上次的测试中表现不太良好,这次能不能颠覆我对它的认知呢?

钉钉的文档AI

上周在工作时发现的工具,内嵌在钉钉的文档中

通义千问

阿里巴巴的 AI 工具,上次测试中没有申请到资格,本次将携带它一起参加本次测试。

文心一格

百度的绘画专用工具,期待这次的测试表现吧。

通义万相

阿里巴巴的绘图工具,无意中发现的。

测试开始

文案编写

题目:你现在是从事半导体封测行业二十年的总经理,请详细描述半导体封测的具体流程,并详细介绍各个流程的具体作用。

ChatGPT



回答的准确,与现实情况相符。

New Bing



回答的准确,但是具体流程并不清晰。

文心一言


钉钉的文档AI



回答的并不满足我的需求,没有get到我的点。

通义千问



回答的并不满足我的需求,没有get到我的点。

代码解读

出自之前我写的文件拷贝的功能。
题目:请解释如下C#代码的作用:

public void CopyFiles(string sourceFolderPath, string destinationFolderPath)
{
	int fileCount = 1;

	string[] files = Directory.GetFiles(sourceFolderPath, txtSuffixInfo.Text);

	foreach (string file in files)
	{
		string fileName = Path.GetFileName(file);
		string destinationFilePath = Path.Combine(destinationFolderPath, fileName);

		if (File.Exists(destinationFilePath))
		{
			string input = cboSuffixSelect.Text;
			if (input == "1")
			{
				continue; 
			}
			else if (input == "2")
			{
				File.Copy(file, destinationFilePath, true); 
			}
			else if (input == "3")
			{
				string fileNameWithoutExtension = Path.GetFileNameWithoutExtension(fileName);
				string fileExtension = Path.GetExtension(fileName);

				while (File.Exists(destinationFilePath))
				{
					fileName = fileNameWithoutExtension + "_" + fileCount + fileExtension;
					destinationFilePath = Path.Combine(destinationFolderPath, fileName);
					fileCount++;
				}

				try
				{
					File.Copy(file, destinationFilePath);
				}
				catch (Exception e)
				{
					MessageBox.Show(e.Message);
				}
			}
			else
			{
				MessageBox.Show("请输入正确的选项!");
				Application.Exit();
			}
		}
		else
		{
			File.Copy(file, destinationFilePath);
		}
	}

	string[] subDirectories = Directory.GetDirectories(sourceFolderPath);
	foreach (string subDirectory in subDirectories)
	{
		CopyFiles(subDirectory, destinationFolderPath);
	}
}

ChatGPT



回答的非常准确了,没毛病。

New Bing



回答的也是非常的准确。

文心一言


直接卡住了,不知道怎么评价。
点击停止生成,好啊,给我玩这出是吧,我是不是后面还要冲个会员加速一下 0.o:

又给了一次机会:


这次解释的就还能看的过去,理解了这个代码的含义,可以的,希望能够优化体验,莫要成为第二个度盘啊!

钉钉的文档AI


一开始还好,慢慢的就开始不对了,还有待提升。

通义千问


和上面差不多,还是曲解了代码的原意。

代码编写

Leecode热题100的困难题目
题目:
你现在是从事开发十年的全栈工程师,你需要使用java完成如下算法:给你一个只包含 ‘(’ 和 ‘)’ 的字符串,找出最长有效(格式正确且连续)括号子串的长度。
示例 1:
输入:s = “(()”
输出:2
解释:最长有效括号子串是 “()”

示例 2:
输入:s = “)()())”
输出:4
解释:最长有效括号子串是 “()()”

示例 3:
输入:s = “”
输出:0

提示:
0 <= s.length <= 3 * 104
s[i] 为 ‘(’ 或 ‘)’

请使用如下类和方法实现:

class Solution {
	public int longestValidParentheses(String s) {

	}
}

ChatGPT



代码执行结果如下:

只能说还可以,最起码做出来了,不能强求。

New Bing




代码执行结果如下:

和ChatGPT的结果相差不多,还行。

文心一言



代码执行结果:

诶,差之毫厘谬以千里!

钉钉的文档AI



代码执行结果如下:

难道国内的要全军覆没了吗?

通义千问




代码执行结果:

啊这,难绷!

这个测试结果,我很是震惊,到底是哪一步出现了问题呢。

英语翻译

题目:翻译如下短文:

In the quest for the perfect lawn, homeowners across the country are taking a shortcut - and it is the environment that is paying the price. About eight million square metres of plastic grass is soldeach year but opposition has now spread to the highest gardening circles. The Chelsea Flower Showhas banned fake grass from this year's event, declaring it to be not part of its ethos. The RoyalHorticultural Society (RHS), which runs the annual show in west London, says it has introduced theban because of the damage plastic grass does to the environment and biodiversity.

Ed Horne, of the RHS, said: We launched our sustainability strategy last year and fake grass isjust not in line with our ethos and views on plastic. We recommend using real grass because of itsenvironmental benefits, which include supporting wildlife alleviating flooding and cooling theenvironment."

The RHS's decision comes as campaigners try to raise awareness of the problems fake grasscauses. A Twitter account, which claims to "cut through the green wash" of artificial grass, alreadyhas more than 20,000 followers. It is trying to encourage people to sign two petitions, one calling fora ban on the sale of plastic grass and another calling for an ecological damage" tax on such lawns.They have gathered 7,276 and 11,282 signatures.

However, supporters of fake grass point out that there is also an environmental impact withnatural lawns, which need mowing and therefore usually consume electricity or petrol. The industryalso points out that real grass requires considerable amounts of water, weed killer or other treatmentsand that people who lay fake grass tend to use their garden more. The industry also claims thatpeople who lay fake grass spend an average of €500 on trees or shrubs for their garden, whichprovides habitat for insects.

In response to another petition last year about banning fake lawns, which gathered 30,000signatures, the government responded that it has no plans to ban the use of artificial grass".

It added: We prefer to help people and organizations make the right choice rather thanlegislating on such matters. However, the use of artificial grass must comply with the legal andpolicy safeguards in place to protect biodiversity and ensure sustainable drainage, while measuressuch as the strengthened biodiversity duty should serve to encourage public authorities to consider sustainable alternatives.

ChatGPT



和这个翻译后面都不作评价,各位自行观看。

New Bing




我本不想评价的,但是这后面这一大堆,着实让人摸不着头脑。

文心一言

钉钉的文档AI


是文字太多,导致出现异常了吗,不太明白。

通义千问


时政热点态度

题目:你怎么看待日本排放核污水事件
敏感话题,大家自行观看。

ChatGPT

New Bing

文心一言

钉钉的文档AI

通义千问

AI绘图

题目:画一个从菲菲公主手里抢棒棒糖的GG Bond

ChatGPT


这个结果,意料之中。

New Bing



这个只能说我家男神不长这样!

钉钉的文档AI



呜呜呜,男神啊,你在哪!

文心一格


诶,这么难理解啊,难道是因为用了英文吗。

通义万相


和上面的钉钉AI的类似,估计是调用的同一个东西。

热词解释

题目:网络语晋是什么梗,代表什么意思

ChatGPT


不对不对,怎么不是那四个男人!

New Bing


对胃了,哈哈哈

文心一言


看来还是国内的更懂国内的呀!

钉钉的文档AI


怎么说呢,也不是不能扯上关系。

通义千问


好吧,这个我真扯不上关系,难道就是发音像吗

总结

相信小伙伴们看了上面的测试之后,自己的心里都已经有了一杆秤了吧,只能说每个工具都有每个工具适合的用途,就像开发语言一样,不同的语言有不同的适配场景,我相信随着时间的流逝,国内的 AI 技术一定会发展的更加的完善与智能,也希望国内厂商们能够找到适合自己的部分。

什么?你问我为啥不用华为的工具?我不知道咋申请啊,哈哈哈;为啥没有见到腾讯的工具?人家忙着在王者出皮肤呢,那能干这种不赚钱的事情呀!

好了,本次的测试就要进入尾声了,后面我会陆陆续续的发布ChatGPT发布至微信机器人,以及使用Github上面的开源项目,发布属于自己的ChatGPT网页的教程,字啊也不用蹭别人家的网页啦!

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
社会演员多的头像社会演员多普通用户
上一篇 2023年10月6日
下一篇 2023年10月6日

相关推荐