全球首个AI程序员Devin诞生,真的不再需要程序员了吗?

前言

今年到底是怎么回事?前有Sora(首个文生视频大模型)独领风骚,后有Mistral(号称世界第二语言大模型)横刀立马,甚至Claude3的热度都还没有过,今天一则更炸裂的消息就爆出,世界上第一个AI程序员诞生了,他的名字叫做:Devin

Devin是什么? 

Devin并不是传统意义上代码编写的辅助工具,它所体现的是未来AI编程解决方案的新趋势。远超传统的编程助手如GitHub Copilot——该工具是GitHub、微软以及OpenAI的共同成果——Devin在软件开发过程中的能力几乎可以说是全方位的。

Devin能够独立地承担起从头到尾的软件开发任务,碾压了仅提供编码建议和自动完成代码片段的传统助手的功能。其操作流程也非常直观:用户只需向Devin提出一个需求,例如:

“设计一个呈现纽约市所有书店的互动地图的应用”,Devin就会立刻着手执行,自动化地搜寻必要信息,诸如书店的准确地理位置、街道地址及联络详情。Devin会开始创建一个展示这些详细信息的网站,并且负责将这个网站成功上线。在整个开发过程中,Devin不仅能够精确执行任务,还能实时更新其进展情况,并在代码编写阶段不断进行测试,以便主动识别并解决任何可能出现的错误。

Devin的独到之处在于它融合了最新的AI技术,具有SWE-Bench 编码基准的最新水平,已经成功通过了领先人工智能公司的实际工程面试,甚至还在 Upwork 上完成了实际工作。

Devin在独立解决问题方面达到了13.86%的成功率,这一成就远超以往最高水平的1.96%。即便是在提供了具体需要修改的文件情况下,先前的顶尖模型也仅能处理4.80%的问题。Devin或许已经真正意义上实现了智能。

光看数据可能并不能直观的感觉到Devin的强大,下面我们来看几个网友的辣评

Devin能够做什么?

Devin展现了其在处理复杂软件工程项目方面的非凡能力,能够进行数千次决策来规划和执行任务。

并且它具备回顾每个阶段必要背景信息的能力,能够逐渐学习并纠正过程中的错误。

此外,开发团队为Devin装备了一系列开发工具,能够在一个安全的沙盒环境中运行的shell、代码编辑器和网络浏览器,实际上是提供了开发人员进行编程工作所需的全部工具。

最重要的是,Devin被设计成能够与使用者紧密合作。它不仅能够即时分享工作进度,还能接收反馈,并在设计决策上与使用者共同作出选择。

在Cognition AI官网发布的几个用例视频中,具体介绍了Devin目前具备的七个功能:

大家可以前去观看视频:博客 (cognition-labs.com)

1.Devin 可以学习如何使用不熟悉的技术

提交一篇博文给Devin之后,它能够在短短几分钟内自学完成,包括阅读文章内容到执行代码。Devin能够在Modal平台上操控ControlNet,进行编程时还能自行进行调试。最终,当程序员Sara希望获得一张包含她名字的个性化桌面壁纸时,Devin迅速响应并生成了所需的壁纸。

2.Devin 可以端到端地构建和部署应用程序

如果你渴望体验「生命游戏」,只需将任务交由Devin即可。Devin会启用Shell工具来初始化一个React应用,接着利用代码编辑器着手编程。编码完毕,Devin不仅完成了代码编写,还会自动将该应用部署至Netlify,轻松开发一个基础版的「生命游戏」。

3.Devin 可以自主查找和修复代码库中的错误

在这个用例中,利用Devin解决了一个BUG,整个流程大概是给了Devin存储库,让它来检查和处理这个存储库,然后发现了其中的问题,并且成功的解决了,起到了维护和调试的作用。

4.Devin 可以训练和微调自己的 AI 模型

Devin 为大型语言模型设置了微调,给出了指向 GitHub 上研究存储库的链接。并且在1小时内,Devin顺利完成了几百步的训练。

5.Devin 可以解决开源存储库中的错误和功能请求

只要有一个指向 GitHub 问题的链接,Devin 就会完成所需的所有设置和上下文收集。

6.Devin 可以为成熟的生产存储库做出贡献,修复系统BUG

此示例是 SWE-bench 基准测试的一部分。Devin 解决了 sympy Python 代数系统中对数计算的错误。Devin 设置代码环境,重现错误,并自行编码和测试修复程序。

7.替代真人,在 Upwork 上给 Devin 提供真正的工作

在这里,Devin 编写和调试代码以运行计算机视觉模型。Devin 对生成的数据进行采样,并在最后编制一份报告。完全胜任了其承担的工作,真正做到了一个智能体的效果。

Devin的团队怎么样?

Cognition AI.是一家专注于推理的应用人工智能实验室。

根据他们自己的介绍:

“我们正在打造人工智能队友,其能力远远超出当今现有的人工智能工具。通过解决推理问题,我们可以在广泛的学科领域开启新的可能性–代码只是一个开始。我们希望帮助世界各地的人们将想法变为现实。

我们拥有充足的资金,包括由创始人基金(Founders Fund)主导的 2100 万美元 A 轮融资。我们非常感谢行业领导者的支持,包括 Patrick 和 John Collison、Elad Gil、Sarah Guo、Chris Re、Eric Glyman、Karim Atiyeh、Erik Bernhardsson、Tony Xu、Fred Ehrsam 和其他许多人。”

纵观Devin这几个实例来看的话,国内也有类似的产品,甚至比Devin发布的时间还要早,后续我们将会展开对这两款产品的进行测评,敬请期待哟 !

版权声明:本文为博主作者:KuaFuAI原创文章,版权归属原作者,如果侵权,请联系我们删除!

原文链接:https://blog.csdn.net/weixin_47201270/article/details/136690564

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
扎眼的阳光的头像扎眼的阳光普通用户
上一篇 2024年4月10日
下一篇 2024年4月10日

相关推荐

此站出售,如需请站内私信或者邮箱!