新闻中心

NEWS CENTER

首个AI软件工程师上线已通过公司口试抢措施员饭碗

更新时间:2024-03-21 08:29:25

  正在 Upwork 接的单里,Devin 被央求编写并调试运转谋略机视觉模子的代码。它采样完毕果数据,结尾透露了一份叙述:

  你给它一篇新博客,讲的是怎么运转 ControlNet on Modal,天生带文字的图像:

  正在杀青项目标进程中,它运用了浏览器为 API 留档,以便它能够阅读并进修怎么插入这些 API:

  官方发的推特说,Devin 不光通过了一家业内领先的人工智能公司的口试,正在自正在职业平台 Upwork 上也能得胜接单,杀青单紧要求的任务。也即是说,Devin 不光是横扫根蒂测试的「做题家」,正在就业墟市里也有人工它的任务才干买账。

  碰到无意的失误时,Devin 断定先「print」出来,再依照日记中的失误断定怎么修复 bug:

  要清楚,固然现正在市情上的一系列大模子都有编程才干,但大无数都采用了单行代码补全或者单个函数天生的形式。念天生完善的次序,还需求策画 prompt 渐渐「」。

  仅从评测结果看,Devin 处分可靠全邦软件题目的才干要远好于此刻的 GPT-4 和 Claude 等模子。

  本文为滂湃号作家或机构正在滂湃音信上传并揭晓,仅代外该作家或机构见识,不代外滂湃音信的见识或态度,滂湃音信仅供给新闻揭晓平台。申请滂湃号请用电脑拜望。

  Devin 乃至不妨磨练和微调己方的 AI 模子,看来 AI 的性命将近正在目前杀青闭环了。Devin 就微调了一个大型讲话模子:

  依照自然讲话提示主动写代码、天生完善的次序并上线只是 Devin 的基操,它能够主动计划并推行需求数千个计划的丰富工作。

  Devin 能主动杀青云云丰富的计划,得益于其背后的 Cognition AI 正在长远推理和计划方面的开展,这使它不妨正在每一步追忆干系的上下文,随时期进修,并修复失误。

  这支团队的成员正在编程竞赛中取得的收获和对题目处分的特有办法。此中三位创始人新闻如下:

  Devin 具有主动的配合的才干,它能及时叙述进度,经受反应,并依照需求调动,还能适宜成熟的代码库,从完整目生的常识进修运用不熟谙的本领,也是 Devin 所擅长的。

  除了这三位重点成员,又有一位 Neal Wu,他是 Scott Wu 的兄弟,他也正在 Cognition AI 任务。Wu 兄弟因其编程才能正在环球界限内享有盛誉,他们自青少年工夫起就正在邦际编码竞赛中比赛并常获告成,这些竞赛经历助助他们正在编程和处分题目方面具有特有的办法。

  Devin 装备了包含 shell、代码编辑器和浏览器正在内的常睹开辟用具,这些都正在一个沙盒化的谋略境况中 —— 这些都是人类软件工程师杀青任务所需的一概。

  看到 Devin 的 Demo 后,刚从 OpenAI 去职的 AI 大牛 Andrej Karpathy 揭橥了少少独到的睹识。正在他看来,主动化软件工程的开展将犹如于主动化驾驶,是一个别工智能做的越来越众,而人类的任务越来越少,但仍供给监视的进程。

  总共 Cognition AI 团队由 10 人构成,包含取得过 10 枚邦际竞赛金牌的运动编码者。

  Scott Wu - 首席推行官 (CEO):Scott 是团队的带领者,和他的兄弟 Neal Wu 沿途,自青少年工夫就初步加入并时时获胜于邦际编程竞赛,曾相接三年揽获 IOI 金牌,这些竞赛晋升了他们的编程才干。Scott 的配景和对算法题目的长远会意为 Cognition AI 的开辟供给了特有的视角。

  莫非继 Sora 让「实际全邦」不存正在了之后,Devin 也要让「软件工程」不存正在了吗?

  Devin 现正在还未对外盛开,但仍旧有开辟职员和产物职员用上了。测试过的网友外现,以前不断用人工智能辅助编码,但不断式微。直到昨天,他给 Devin 了一个大略的 HTML 页面,让它提取抉择器,这个 GPT-4-turbo 、Claude、Groq 、LLama2 都没杀青的工作,Devin 只用了大约 10 秒就搞定了。

  正在 SWE-Bench 根蒂测试中,无需人类协助,Devin 就能够处分 13.86% 的题目。而目前的 SOTA 模子,正在没有人类协助的境况下,只可杀青 1.96% 的工作。

  Walden Yan - 首席产物官 (CPO):Walden 直到近来还正在哈佛大学上学,他要求将他正在学校的状况留作含混,大约率是念「辍学创业」。

  比如请它正在几个差别的 API 上对 Llama 的涌现实行根蒂测试,它最初拟订了一个渐渐处分题目的方针:

  前段时期,英伟达 CEO 黄院士发出惊人群情:「都别学编程了,今后交给 AI 就行了,今后人人都是软件工程师。」当时又有良众人阻挠,说「AI 永恒不会庖代次序员。」没念到,首个别工智能软件工程师 Devin 一揭晓,次序员的饭碗大概真要被 AI 端走了。

  总体来看,与其他具有编程才干的大模子,Devin 不光辅助编程或供给代码片断,它不妨独立支撑一总共项目,而不光仅是辅助或供给代码片断的提议。比拟于「副驾驶」的脚色,Devin 更靠近于一个独立任务家。而 Cognition AI 声称 Devin 告终了正在 AI 规模被称为「会意」的冲破,这意味着它不妨不光是正在预测下一个单词或代码行该当输出什么,而是更像正在思虑怎么处分题目的总体办法。

  Devin 大概是通向来日,人类正在更高层级实行笼统监视的进程中一环,正在这个进程中仍有良众题目需求处分。比如,人工智能部门以及用户界面 / 用户体验部门都有良众任务要做。人类怎么供给监视他们怎么领导人工智能走向差别的旅途?他们怎么调试犯错的地方?代码编辑器的策画有大概需求大幅革新。

  而 Devin 的本领旅途,CognitionAI 并还未公然,只是扼要塞提到,Cognition AI 的团队发觉了将大型讲话模子(LLM)如 OpenAI 的 GPT-4 与深化进修本领联络的特有办法。这种办法大概是他们本领冲破的闭头点。