摘要:带队的人来头不小,David Luan,华人,六岁从中国搬到美国,八岁就跑去大学读计算机夜校,五年后他居然真拿下了计算机科学的证书,这经历放今天看都相当厉害。
文 /编辑:雨
亚马逊这波在人工智能上的投入,明显是要动真格的,以往大家对亚马逊的印象,可能还停留在“网上啥都能买”的电商巨头,或者背后支撑无数网站的云服务商AWS。
但其实,从去年开始,它已经不再满足于只做底层支持的角色,而是直接下场,在旧金山组建了一个专注AGI(通用人工智能)的实验室。
这个实验室不像普通的产品团队,目标不是改善现有的语音助手或者多卖几件商品,而是要开发出能真正理解人类意图、并能主动帮人干活的AI智能体。
带队的人来头不小,David Luan,华人,六岁从中国搬到美国,八岁就跑去大学读计算机夜校,五年后他居然真拿下了计算机科学的证书,这经历放今天看都相当厉害。
之后他进入耶鲁读数学和政治,但心里一直装着计算机,2011年大多数公司连深度学习是啥都还没搞明白,他就已经开始创业做视频分类模型,还被美国政府用在执法记录仪上。
之后他的职业路径几乎就是踩着AI发展的关键节点走的:2018年加入OpenAI,那时团队才几十人,他担任工程副总裁,负责的不是写论文,而是把GPT-2、GPT-3从研究原型变成真正能用的工程系统。
后来他又去了Google Brain带队大语言模型,但待了一年就走了,原因是他觉得谷歌虽然资源多,但内部结构复杂,各部门抢计算资源、业务重心又放在广告和搜索上,很难从零开始做更有野心的研究。
于是2022年,他拉上Transformer论文的两位作者和其他几位技术牛人,一起创办了Adept AI,那时候ChatGPT还没发布,行业里对大模型的想象大多还停留在“生成文字”层面,但他们已经认定:AI不应该只会说话,还得会做事。
他们推出了一个叫ACT-1的模型,可以通过看屏幕、读文字指令来操作软件、填表单、点按钮,今天听起来不稀奇,但在三年前,这思路相当超前。
除了Luan,这个团队里还有好几个行业里公认的高手,比如Pieter Abbeel,加州大学伯克利分校的教授,强化学习领域的奠基人之一,之前创立的机器人公司Covariant也被亚马逊一并收编。
再比如Kelsey Szot,负责产品方向,早年待过麦肯锡和谷歌,特别擅长把研究变成用户能用的产品;还有Erich Elsen,之前在DeepMind研究GPU计算和稀疏模型,是Chinchilla定律的作者之一,这几个人放哪都算得上顶尖配置。
而他们交出的第一个作品,是一个叫Amazon Nova Act的模型,它不像聊天机器人只会回答文字问题,而是能真的操作软件、处理多步骤任务。
比如在企业系统里自动处理订单、修改报表、管理库存,甚至操作CAD画图或者电子病历,它不像传统自动化工具要靠人编规则,而是通过模拟环境自学成才,团队把它称为“AI健身房”,里面摆满了各种软件,让AI反复尝试、自我博弈,慢慢摸出门道。
亚马逊这么拼命,背后其实有很强的危机感,如果未来AI助手真的成熟了,人们可能不再上网站购物,而是直接让Agent代劳,“帮我买最便宜的充电宝”或者“下周给爸妈送一箱橙子”,那亚马逊现在的电商业务、广告收入、佣金模式都会受到巨大冲击。
所以它必须自己先做出这样的Agent,不能把入口拱手让人,但从技术到真正普及,这条路并不好走。
大公司内部跨部门协作本就复杂,AGI研发又特别耗资源;AI在实际操作中一旦出错可能引发信任危机;再加上数据隐私和监管审查越来越严——亚马逊要想真正把Agent做成功,还得解决很多问题。
不过,有数据、有算力、有场景,还有一帮既懂研究又懂工程的人,亚马逊这次的决定,显然不是跟风玩概念,它正在悄悄调整船头,而这一把赌注,可能会影响整个AI行业未来的格局。
来源:淩轩a