专访 Anthropic CEO:2025 年要解决的两大问题,以及为何不将 Computer Use 产品化

B站影视 2024-12-10 20:14 2

摘要:Dario Amodei 曾在谷歌、OpenAI 这两个全球领先的人工智能(AI)实验室工作。在 OpenAI,Amodei 推动公司的核心研究战略,在 5 年时间里建立了 GPT 模型,一直待到 2021 年——也就是 ChatGPT 推出的前一年。

Dario Amodei 曾在谷歌、OpenAI 这两个全球领先的人工智能(AI)实验室工作。在 OpenAI,Amodei 推动公司的核心研究战略,在 5 年时间里建立了 GPT 模型,一直待到 2021 年——也就是 ChatGPT 推出的前一年。

因对技术的未来存在分歧而辞职后,Amodei 与妹妹 Daniela 共同创办了 Anthropic,之后发布了对标 ChatGPT 的聊天机器人 Claude。

今年早些时候,Anthropic 的估值已经超过了 180 亿美元。上个月,亚马逊又投资了 40 亿美元,使其投资总额达到 80 亿美元,这是其有史以来最大的风险投资。当前,亚马逊正在努力将 Claude 嵌入其下一代智能助理 Alexa 中。

在与英国《金融时报》记者 Madhumita Murgia 的对话中,Amodei 谈到了:

Anthropic 在 2025 年要解决的两大问题;

人们使用更强大模型的新方式;

Artifacts;

以及为何不以产品的形式推出 Computer Use,或者说对智能体的担忧;

......

全文如下:

Madhumita Murgia:我想先谈谈您的文章《仁慈的机器》(Machines of Loving Grace),这篇文章深入浅出地描述了人工智能造福社会的方式。为什么现在选择如此详细地概述这些好处?

Dario Amodei:从某种意义上说,这并不是新鲜事了,因为人工智能的风险和好处之间的对立,在过去两三年里一直在世界范围内讨论。没有人比我更厌倦这种对立。在风险方面......我试着说得具体一点。在利益方面,技术乐观主义是非常积极的,对吗?你会在推特上看到开发者在谈论“build、build、build”,他们会分享一些例子。但是,这些积极的好处确实不够具体。

MM:当人们谈论好处时,有很多假设。你是否觉得人们有点疲劳?他们从未被[告知]这实际上会是什么样子?

DA:是的,正面的解释要么非常模糊,情绪化,要么非常极端。整个奇点论述是......“我们都将把自己上传到云端,无论你遇到什么问题,人工智能当然会立即解决”。我认为这太极端了,而且缺乏细节。

我们能否真正设想出一个美好的、人们愿意生活在其中的世界?哪些具体事物会变得更好?围绕它们的挑战又是什么?

如果我们看看癌症和阿兹海默病等疾病,它们并非不可解决的神秘现象。尽管它们的复杂程度令人难以置信,但人工智能擅长解决复杂问题。这不会立马发生。但是,我们会一点一点地解开我们以前无法解决的复杂问题。

MM:是什么吸引你选择生物学、神经科学、经济发展等领域?

DA:我关注的是那些能给人类生活带来最大改变的领域。对我来说,生物学和经济发展就是这样的领域。世界上有很多地方,没有我们在发达国家开发的这些发明。我想针对我立即想到的一些能预测和决定人类生活好坏的最大因素进行研究。

MM:在一个理想的世界里,你希望 Anthropic 在 2025 年解决什么问题?

DA:有两件事:一是机理可解释性(mechanistic interpretability),即观察模型内部,打开黑盒子,了解其中的奥秘。我认为这是目前人工智能研究中最令人兴奋的领域,或许也是对社会最重要的领域。

第二个是人工智能在生物学中的应用。我从生物科学转向人工智能的一个原因是,我研究了生物学的问题和......。它们似乎几乎超出了人类的理解能力——并不是说它们在智力要求上有多高,而是信息量太大,太复杂了。

我和该领域的其他一些人一样——我认为 Demis Hassabis 也也有这样的动机——希望利用人工智能来解决科学问题,特别是生物学问题,从而让人类生活得更好。

Anthropic 正在与制药公司和生物技术初创公司合作,但这在很大程度上还停留在“我们现在如何应用 Claude 模型”的层面。我希望我们能在 2025 年开始,与公司、研究人员和学者一起,真正开展更具更具长远宏伟蓝图和长期抱负的工作。

MM:你在推动人工智能技术前沿发展方面发挥了重要作用。Sonnet 3.5 已经发布 5 个月了。与一些之前的模型相比,人们是否在以新的方式使用它?

DA:我举个编码领域的例子。我见过很多编码能力很强的用户,包括 Anthropic 内部一些最有才华的人,他们说以前的模型对[他们]根本没用。他们正在解决一些难题,一些非常困难和技术性的问题,而他们从来没有感觉到以前的模型实际上会帮他们节省时间。

这就像你与他人合作:如果对方甚至不具备你所具备的技能,那么与他们合作可能就没有用处。

但我看到,越来越多的极具天赋的研究人员、程序员、员工......对他们来说,Sonnet 3.5 是第一次真正对他们有帮助的模型。

我想说的另一件事是 Artifacts:Claude 消费者端的工具。[有了它,]你可以进行反复开发。你可以告诉模型:“给我做一个主角长这样、环境长这样的电子游戏”。然后,Claude 就会帮你做出来。[但]你可以回去和它谈谈,说:“我觉得我的主角看起来不对,他看起来像马里奥。我希望他更像路易吉”。你可以和人工智能系统合作开发一些东西。

MM:这是否带来了令你兴奋的收入流或商业模式?你认为在这些新功能的基础上,会有新的产品出现吗?

DA:是的。虽然我们有一个消费者产品,但 Anthropic 的大部分业务都是通过 API 向其他企业销售我们的模型,他们在此基础上构建这些产品。因此,我认为我们在生态系统中的总体定位是,我们正在帮助其他公司打造这些令人惊叹的产品,我们已经看到了很多令人兴奋的产品。

例如,上个月,我们向开发者发布了一项名为“Computer Use”的功能。开发者可以在这项功能的基础上进行开发:你可以告诉它“为我预订这家餐厅”或“计划这一天的旅行”,然后模型就会直接使用你的电脑。它会看着屏幕,点击鼠标的不同位置,还会用键盘输入内容。

它不是实体机器人,但能输入......为你自动控制电脑。在我们发布后的几天内,就有人发布了可控制 iPhone 屏幕、安卓屏幕、Linux、Mac 的版本。

MM:你会把它作为自己的产品发行吗?现在到处都在说智能体(agent)这个词。你也可以有自己的智能体,对吗?

DA:是的,我可以想象我们可以直接制造出这样的产品。实际上,我认为智能体最具挑战性的一点是确保它们安全、可靠和可预测。与聊天机器人交谈是一回事,它可能会说错话,可能冒犯某人,可能会误导别人。当然,我们应该认真对待这些事情。但是,当我们开始与智能体合作时,确保模型完全按照我们的要求去做就变得更加重要了。

MM:有哪些挑战?

DA:作为一个思想实验,想象一下我有一个智能体,我说“帮我在互联网上做一些研究,形成一个假设,然后去买一些材料来制造[一些]东西,或者按照我的交易策略做一些交易”。一旦模型在外面的世界做了几个小时的事情,它们就有可能做一些我不想让它们做的事情。

也许它们正在以某种方式更改我电脑上的设置。也许它们在代表我与人交谈时,说了一些我根本不会赞同的话。也许它们正在对另一组服务器采取某些行动。甚至可能是恶意操作。

因此,我们需要驯服这种「难以驾驭性」和「不可预测性」。我们已经取得了很大进展。它所使用的方法与我们用来控制普通系统安全的方法相同,但所需的可预测性水平要高得多。

我知道这就是阻碍它的原因。这不是模型的能力问题。我们要做的是,让人们相信,我们可以放心地发布这样的产品,它能可靠地完成人们想要它做的事情;让人们真正信任它。

一旦我们达到这个目标,我们就会发布这些系统。

MM:是的,从告诉你一些你可以采取行动的事情,到为你采取行动,这其中的利害关系要大得多。

DA:你想让电脑内部的“小精灵”随意改变一些东西吗?你可能永远都不会知道是什么改变了这些东西。说白了,我认为所有这些问题都是可以解决的。但这些都是我们在设计这样的系统时所面临的实际挑战。

MM:那么,你认为我们什么时候才能对这些智能体有足够的可预测性和习以为常,让你能够推出一些东西呢?

DA:这是一款早期产品。它的可靠性并不高。不要把关键任务交给它。我认为,到 2025 年,我们会在这方面取得很大进展。因此,我预测 2025 年将会有产品大致做到这一点,但这并不是“非黑即白”。总会有一些任务,你不太信任人工智能系统,因为它不够聪明、不够自主或不够可靠。

我希望我们能达到这样的程度:你只需给人工智能系统布置几小时的任务——类似于你给人类实习生或员工布置的任务。每隔一段时间,它就会回到你身边,询问你的意见,然后完成任务。如果我想有一个虚拟员工,我可以让它去做几个小时的研究,写一份报告——想想管理顾问或程序员——人们[必须]相信,它真的会完成你说的任务,而不是其他疯狂的事情。

MM:最近有人谈到,这些能力可能正在趋于稳定,我们开始看到当前技术的极限,这就是所谓的“缩放定律”(scaling law)。你是否看到了这种迹象,并在寻找其他方法来提升这些模型的智能?

DA:我在这一领域工作了 10 年,在这期间的大部分时间里,我一直在关注 scaling law。我认为,我们看到的情况在很多方面都很普通,在这个领域的历史上也发生过很多次。只是,由于该领域是一桩更大的交易,会产生更多的经济后果,所以[现在]有更多的人在关注它。而且对非常模糊的数据进行了过度解读。

如果我们回顾历史,scaling law 并不是说只要训练出一个更大的模型,它就会表现得更好。scaling law 的意思是,如果你根据模型大小与数据的比例对模型进行 scale up,如果所有的工程流程都能很好地训练模型,如果数据质量保持不变,当你对模型进行 scale up 时,[那么]......模型会越来越好。

MM:正如你所说,这不是一个数学常数,对吗?

DA:这是一个观察到的现象,我没有看到任何反对这一现象的证据。我们没有看到任何东西可以反驳我们在过去几年里看到的模式。我所看到的情况是,由于第一次没有以正确的方式 scale up,所以看起来好像事情正在趋于平稳。但在第四、五次后情况就会不同了。

MM:那么在当前,当你查看当前模型的训练运行时,是否存在任何限制?

DA:我曾多次谈到合成数据。随着自然数据的耗尽,我们开始增加合成数据的数量。例如,AlphaGo Zero 就是用合成数据训练出来的。此外,还有推理方法,让模型进行自我反思。因此,有很多方法可以绕过数据墙。

MM:当我们谈到扩展时,最大的问题就是成本。成本似乎在急剧上升。成本如此上涨,像 Anthropic 这样的公司如何生存?未来一年左右,这些钱从哪里来?

DA:我认为人们会继续理解这项技术的价值和潜力。所以我很有信心,一些资助过我们的大公司和其他公司,以及投资生态系统,都会支持这项技术。

而且收入增长非常快。我认为这个数学计算是可行的。我非常有信心,从模型成本的角度来说,100 亿美元的水平是 Anthropic 能够负担得起的。

就盈利能力而言,这是很多人都弄错的一件事。人们通常会看:某一年你花了多少钱,某件事花了多少钱。但实际上,研究特定的模型更有启发性。

让我们假设一家公司。假设你在 2023 年训练了一个模型。该模型耗资 1 亿美元。然后,在 2024 年,这个模型产生了比如说 3 亿美元的收入。然后,在 2024 年,你要训练下一个模型,这个模型的成本是 10 亿美元。而这个模型还没有完成,或者在 2024 年底才发布。当然,它要到 2025 年才能产生收入。

所以,如果你问“2024 年公司是否盈利”,那么,你赚了 3 亿美元,花了 10 亿美元,所以看起来并不盈利。如果问每个模型都盈利吗?那么,2023 的模型的成本是 1 亿美元,而收入是几亿美元。因此,2023 的模型是盈利的。

这些数字不是 Anthropic 的数字。但我在这里要说的是:模型的成本在上升,但每个模型的收入也在上升,这在时间上是不匹配的,因为模型的部署大大晚于它们的训练。

MM:你认为包括 Anthropic 在内的公司有可能在没有超级金主(如亚马逊或谷歌)的情况下做到这一点吗?你是否担心他们的权力集中,因为没有他们的资金,没有他们的基础设施,建立 LLM 的初创公司实际上无法开展工作?

DA:我认为与大公司的交易对双方都很有意义,因为投资是将未来带入现在的一种方式。我们主要需要用这笔钱购买芯片。公司和超级金主都要在云上部署产品,而云也是由他们运行的。因此,这在经济上是合理的。

我当然担心超大型企业的影响,但我们在做交易时非常谨慎。

对 Anthropic 而言,最重要的是我们负责任的扩展政策,其基本原则是:当模型的能力达到一定水平时,就必须对其能力进行衡量,并在使用时采取保障措施。

在我们与超级金主达成的每一笔交易中,他们在部署我们的技术时,都必须遵守我们的扩展策略规则。这与我们在什么地方部署模型无关。它们必须经过我们负责任的扩展所要求的测试和监控。

另一件事是,我们的长期利益信托基金。这是一个最终监督 Anthropic 的机构。它拥有任命 Anthropic 董事会许多席位的权力。同时,超大规模企业在 Anthropic 董事会中没有代表。因此,公司的最终控制权仍然掌握在长期利益信托基金手中,而长期利益信托基金是财务上无利害关系的行为者,对 Anthropic 拥有最终权力。

MM:你认为,在没有亚马逊、谷歌或微软的情况下,今天的 LLM 公司还能继续在所生产的产品及其对人们的影响方面掌握权力吗?

DA:我认为在保持对公司控制的同时,这样做在经济上是可行的。同时保持你的价值观。我认为,这样做需要从某个地方获得大量资源。这些资源可以来自超级金主。理论上,也可以来自风险投资系统。甚至可以来自政府。

我们已经看到一些案例,无论好坏,[其中]像 Elon Musk 这样的人正在利用他们庞大的私人财富。我确实认为,要建立这些非常庞大的基础模型,需要一些非常庞大的资金来源,但也有许多不同的资金来源。我认为,在坚持自己价值观的同时,也可以做到这一点。

MM:展望通用人工智能(AGI)或超级智能,你如何设想这些系统?我们需要新的想法来实现下一个突破吗?还是会不断迭代?

DA:我认为,创新将与产业升级并存。要实现非常强大的人工智能,我认为不存在某一个点。随着时间的推移,我们的系统会越来越强大。我的看法是,我们基本上已经步入正轨,不太可能需要很久了。是的,这将是持续的,但速度很快。

阅读报告全文,请访问欧米伽研究所的“未来知识库”

未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问进入。

截止到11月25日 ”未来知识库”精选的100部前沿科技趋势报告

Air Street Capital《2024 年人工智能现状报告》

未来今日研究所:2024 技术趋势报告 - 广义计算篇

科睿唯安中国科学院 2024 研究前沿热度指数报告

文本到图像合成:十年回顾

《以人为中心的大型语言模型(LLM)研究综述》

经合组织 2024 年数字经济展望报告加强连通性创新与信任第二版

波士顿咨询 2024 全球经济体 AI 成熟度矩阵报告

理解世界还是预测未来?世界模型的综合综述

Google Cloud CSA2024 AI 与安全状况调研报告

英国制造商组织 MakeUK2024 英国工业战略愿景报告从概念到实施

花旗银行 CitiGPS2024 自然环境可持续发展新前沿研究报告

国际原子能机构 2024 聚变关键要素报告 - 聚变能发展的共同愿景

国际可再生能源署 IRENA2024 年全球气候行动报告

Cell: 物理学和化学 、人工智能知识领域的融合

智次方 2025 中国 5G 产业全景图谱报告

未来今日研究所:2024 技术趋势报告 - 移动性,机器人与无人机篇

Deepmind:AI 加速科学创新发现的黄金时代报告

PitchBookNVCA2024 年第三季度全球风险投资监测报告

德科 2024 年未来全球劳动力报告

高工咨询 2024 年协作机器人产业发展蓝皮书

国际能源署 IEA2024 年全球能源效率报告

基因慧基因行业蓝皮书 2024 - 2025

普华永道 PwC2024 全球经济犯罪调查英国报告 - 智对风险直面挑战

中国互联网协会 2024 面向未来网络的数字孪生城市场景应用白皮书

中移智库 2024 先进感知新技术及新应用白皮书

智次方研究院 2025 中国 AIoT 产业全景图谱报告

未来今日研究所:2024 技术趋势报告 - 人工智能篇

国际电联:迈向衡量数字经济的通用框架的路线图

联合国粮食与农业组织:2024 年世界粮食安全和营养状况

大语言模型综述

李飞飞等,AI 智能体:探索多模式交互的前景综述

哈尔滨工业大学 - ChatGPT 调研报告

2024《美国核部署战略报告》最新文件

清华大学:AIGC 发展研究 3.0 发布版 b 版

OpenAI:2024 年 OpenAI o1 大模型技术报告

Verizon2024 年世界支付安全报告

皇家学会哲学学报 从复杂系统角度评估人工智能风险

复旦大学 大模型 AI 代理的兴起和潜力:综述

经合组织 OECD2024 年气候行动监测报告

Wevolver2024 年边缘人工智能现状报告 - 探索各行业边缘 AI 应用动态

2024 全球人形机器人产品数据库报告 - 人形机器人洞察研究 BTIResearch

《全球金融稳定报告》 把舵定航 不确定性、人工智能与金融稳定

瑞士洛桑联邦理工学院 《人工智能中的 - 创造力:进展与挑战》

《你所需要知道的理 - 论:人工智能、人类认知与决策》牛津大学最新 53 页报告

世界经济论坛 新兴技术时代的网络弹性导航:应对复杂挑战的协作解决方案 2024

ADL 理特咨询 2024 汽车出行未来展望报告

2024 中国硬科技创新发展白皮书 - 开辟未来产业新赛道

科学时代的大语言模型中的人工智能

Gartner2025 年重要战略技术趋势报告

CBInsights2024 年第三季度全球人工智能投融资状况报告

TrendHunter2025 年全球趋势报告 - 全行业顶级创新和变革趋势前瞻

天津大学 2024 大模型轻量化技术研究报告

欧洲海洋局 2024 导航未来报告将海洋置于更广泛的地球系统中第六版

美国安全与新兴技术中心 2024 AI 生成代码的网络安全风险研究报告

国际原子能机构 2024 年世界聚变展望报告

复旦大学 2024 大语言模型的能力边界与发展思考报告

安盛 AXA2024 年气候与生物多样性报告气候过渡计划路线图

YouGov2024 美国公众对人工智能 AI 的态度调研报告

麦肯锡中国报告:《中国与世界》完整版

麦肯锡全球研究所 2024 下一代竞技场报告 - 重塑全球经济的 18 个新兴行业领域

Project Sid,一个旨在模拟多智能体交互以研究 AI 文明的项目

德国研究与创新专家委员会 德国研究创新与科技成果报告

2024 年欧洲关键产业的科技重塑研究报告

智能体专题报告之二 - 智能体时代来临具身智能有望成为最佳载体

ActivateConsulting 2025 年顶级技术和媒体发展趋势报告

兰德 全球灾难风险评估

斯坦福李飞飞 《AI agent 综述》Agent AI 开启多模态交互新纪元

中国联通研究院 2024 中国生成式人工智能应用与实践展望白皮书中文版

普华永道 2024 第五次工业革命研究报告迈向弹性可持续和以人为本的未来

大成 Dentsons2024 年全球智慧城市与互联社区智库年度报告

TechUK2024 量子技术挑战与机遇并存构筑量子韧性的策略与实践研究报告

Emakina 将塑造 2024 年的技术趋势报告

图灵奖得主 Yann LeCun《机器如何才能达到人类智能水平?》——Yann LeCun, 附 Slides 及视频

华为:2024 鸿蒙生态应用开发白皮书 V3.0(最新版)

CASA:2023 第三代半导体产业发展报告

大型视觉语言模型中幻觉现象的综述

IEA PVPS:2024 光伏应用趋势报告(英文版)

ABI Research:82 个将会或不会在 2024 年发生的技术趋势白皮书

《美国反无人机系统未来趋势报告(2024 - 2029 年)》

《军事自主系统:未来之路》美空军

空间智能如何?牛津大学博士论文《深度具身智能体的空间推理与规划》

2024 低空经济场景白皮书 v1.0

战略与国际研究中心(CSIS)人类地月空间探索的总体状况研究报告(2024)

Artificial Intelligence Review:人工智能与物理学相遇的综述

麦肯锡:全球难题,应对能源转型的现实问题

欧米伽理论,智能科学视野下的万物理论新探索(研究论文)

Gartner 2025 年主要战略技术趋势研究报告

2024 人工智能国外大模型使用手册 + 中文大模型使用手册

详解光刻巨人 ASML 成功之奥妙 - 241015

CB Insights:未来变革者:2025 年九大科技趋势研究报告

国际电信联盟 2023 - 2024 年联合国人工智能 AI 活动报告

《人工智能能力的人类系统集成测试和评估》最新 51 页,美国防部首席数字和人工智能办公室(CDAO)

2024 瑞典皇家科学院诺贝尔化学奖官方成果介绍报告

MHP 2024 全球工业 4.0 晴雨表白皮书

世界经济论坛白皮书《AI 价值洞察:引导人工智能实现人类共同目标》

瑞典皇家科学院诺贝尔物理学奖科学背景报告资料

AI 智能体的崛起:整合人工智能、区块链技术与量子计算 (研究报告,书)

OpenAI o1 评估:AGI 的机遇和挑战(280 页)

世界知识产权组织:2024 年全球创新指数

美国白宫:国家近地天体防御策略与行动计划

上下滑动查看更多

来源:人工智能学家

相关推荐