张萌
这家刚刚成立才两个多月但已经有十名天资聪颖的工程技术人员的初创公司Cognition,最近大出风头。

图片来源于tryopen网站
他们推出一款名为Devin的全新人工智能(AI)助手。这款新助手与现有的大部分AI开发人员不同,它可以自动生成网站,并将其部署在服务器上;它还可以解决bug、学习新技能等任务;人类用户只需从命令开始操作,监控并指导整个过程即可完成所有开发工作。
这是第一个完全自主设计和编码的AI软件工程师,一经出场,就立即引起巨大轰动。人们不禁担忧:难道人类编程员也要面临失业的危险吗?
“成绩远高于平均水平”的表现
来自Cognition官网的报告称,Devin只需要一句话命令就可以从头至尾完成一个项目开发。
如果满足用户的要求,Devin 可以同时完成一系列的任务流程。当人类工程师需要实时监控任务的进展时,他们便可以在任何时候跳出命令来检查进度。这样一来,人类工程师就可以将大部分的工作“外包”给AI,专注于创新性的项目设计上。

德维恩与其他人工智能的性能比较,展示了他们在SWE-bench基准测试中的成绩。该图片出自认知实验室的官方网站。
在SWE-bench基准测试中, Devin 表现超出 Claude2、Llama 和 GPT-4 等选手,在 13.86% 的问题上正确处理全部内容。相比之下,GPT-4 只能正确处理其中的 1.74%,私家侦探,侦探公司,调查公司,查人找物,商务调查,出轨外遇调查,婚外情调查,私人调查,19209219596更需人工帮助来明确编辑哪些文件。
这一成就表明AI在过去几年里取得了巨大进步,能够在独立处理软件开发相关问题中起到关键作用。最新的进展显示,由Devin负责的项目已经得到了当地一家知名的科技公司的青睐,并以一种新颖的方式成功提交了实际的工作成果。
几乎完全是自己完成的
Devin 的优点还在于它能策划并且执行那些复杂艰巨的任务,这些任务通常涉及到成千上万的选择和决定才能完成。不论其进展到了哪一个阶段,在此期间,它都能调用所有的相关上下文信息,确保逻辑的连贯性,并且能够随时纠正错误。
这一发现更为惊人:Devins能帮人解决问题,并且涵盖了解决方案的整个流程。
例如,当工程师需要设计一款网页游戏时,Devin可以先生成整个网站的内容,接着完成服务器端的部署,并且直接发布上线,省去了中间很多的人工操作。甚至在发现任何漏洞的时候,Devin也可以追踪错误出现的位置,并根据错误给出相应的解决方案
另外,作为一位全面而高效的AI助手,Devin 还能够帮助人类训练及优化其他的AI系统。如果你需要某个具体模型的操作指南,只需简私家侦探,侦探公司,调查公司,查人找物,商务调查,出轨外遇调查,婚外情调查,私人调查,19209219596单地说出模型的名字,Devin就能知道该怎样开始处理。
那么人们应该怎么做呢?按照设想,最终的Devin应该让人类只下达命令就可以了,不需要动手去做。
软件产业有着深远的影响
创业小集团Cognition虽然只有一十一名成员,但手上有十枚IOI(国际信息学奥林匹克竞赛)奖牌,由三名华裔成员组成的核心团队。
Devlin还处在内部测试期间,感兴趣的用户可提出申请,请求进入测试版。当前,团队并未揭露更多的关键技术信息,但表示Devin诞生于对其多年的研究和规划发展。开发仅是一部分,这款人工智能助手可以应用于更加广泛的领域。
Derek的现身或许会为软件开发领域带来重大的转变,并可能会削减对人工代码编写人员的需求。不过需要注意的是,这项技术依旧处在前期研发阶段,还需更多的研究和试验以确定它的实用性及可靠性。
到目前为止,德维恩的成功使当代软件开发人员有了全新的、改进的AI协作方式,从而可以专注于创新性的任务,并有效提高了工作效率和生产力水平。
顶: 8踩: 61




评论专区