摘要:来自宾夕法尼亚州佩恩阿盖尔的 72 岁退休人员简·威廉姆森 (Jan Williamson) 经常发现自己通过 ChatGPT 来寻找问题的答案,而不是使用以前的旧搜索备用工具:谷歌。
来自宾夕法尼亚州佩恩阿盖尔的 72 岁退休人员简·威廉姆森 (Jan Williamson) 经常发现自己通过 ChatGPT 来寻找问题的答案,而不是使用以前的旧搜索备用工具:谷歌。
“它会提供大量的基本信息,如果你需要的话,它还会提供扩展信息,涵盖你能想到的任何主题。现在我经常用它来获取我不明白或好奇的信息。”威廉姆森说。
但如果威廉姆森与 ChatGPT 的对话时间过长,她就会注意到 ChatGPT 可能会开始耗尽能量,尽管拥有为人工智能背后的计算提供动力的庞大数据库。
正因如此,Anthropic 由亚马逊投资的 Claude 4 AI模型上周因其突破性的连续工作七小时的能力而备受瞩目。
Claude 不会去咖啡机旁,也不会在饮水机旁闲聊。他会工作,一连工作七个小时。但随后,就像一个在长时间轮班结束后疲惫不堪、脾气暴躁的办公室职员一样,Claude 也开始精疲力竭。
对于那些习惯于随时随地使用人工智能的人来说,Claude 或其他任何人工智能程序都设有工作时间上限,这确实令人惊讶。但在人工智能军备竞赛中,七小时的工作时间已经是一个突破的障碍。
“Anthropic 在 Claude Opus 4 上取得的成就是人工智能领域一项令人难以置信的、无与伦比的壮举。
在目前的标准要求模型花费几秒到几分钟的时间来解决问题的情况下,一个模型连续七个小时完成一项任务是闻所未闻的,”Info-Tech Research Group 首席研究总监 Brian Jackson 表示。
“人工智能无法全天候工作,因为它有点像一条金鱼,住在一个非常昂贵的水族箱里。它之所以像金鱼,是因为它只能记住有限时间段内的事情,而水族箱之所以昂贵,是因为它需要高端 GPU 或 TPU 以最高性能运行来创造环境,”杰克逊说。
增加所谓的“代币”的数量是人工智能长期发挥作用的关键。
在人工智能术语中,token 并非指公交车费,而是 AI 模型通过提示习得的单词或单词片段。它们是衡量 LLM 记忆容量的重要指标。当在 ChatGPT 中输入“这句话在 AI 中使用了多少个 token?”时,它会显示使用了 10 个 token。
上下文窗口中的标记数量是决定内存的指标,Claude Opus 4 可以容纳 200,000 个标记,几乎是 ChatGPT 的 128,000 个标记的两倍。
但一旦达到该限制,“上下文窗口就会被刷新,你必须重新开始,”杰克逊说。
使用人工智能的商业融资公司 Credibly 的首席战略和营收官 MJ Jiang 表示,像 ChatGPT 这样的人工智能工具在长时间对话中经常出现性能下降的原因是,模型可能会开始“忘记”之前的指令,并产生质量较低的响应。
这是由于上下文窗口大小、令牌限制以及管理大量信息的计算负担等限制造成的。结果,旧的对话可能会被丢弃,导致准确性降低、反应时间变慢以及连贯性丧失。
Claude 的七小时工作之所以引人注目,是因为这意味着连续执行而不会降低性能,这是“一项令人印象深刻的成就,因为需要强大的计算能力才能长期保持稳定的输出”,蒋说。
这也引发了一个问题:对于人工智能来说,24 小时工作制还有多远?
归根结底,计算能力是关键制约因素。虽然 Claude 和 ChatGPT 正在发挥作用,但这些 GPU 和 TPU 仍在努力实现目标,而这成本高昂,需要大量的冷却和电力。虽然计算效率将持续提升,但这需要在成本、可访问性和环境影响方面做出权衡。
杰克逊说:“Anthropic 可能希望对这些超级会议的成本进行某种限制,否则可能会让银行破产。”
人工智能对环境的影响正在迅速增长。我们可以预见,未来对水冷的需求将非常巨大,水资源短缺的情况将变得更加普遍。
虽然未来 24 小时人工智能工作制在技术上是可行的,但蒋教授认为,更重要的问题是,我们是否应该追求它,以及要付出什么代价?
姜瑜表示:“在其他力量提出要求并导致各方都无法达成最优结果之前,我们或许应该明智地考虑一下自我施加限制。”
图罗大学技术研究生院教授杰里米·拉姆巴拉恩 (Jeremy Rambarran) 表示,24 小时人工智能将改变游戏规则,但长期记忆的开发以及持续存储和检索记忆的过程在规模化时会变得技术复杂且成本高昂。
“从 7 小时的会话过渡到持久、记忆力强、持续活跃的人工智能代理,就像从计算器转变为全职研究助理一样。它将人工智能从单纯的工具转变为合作伙伴,”Rambarran 说。
无论重点是药物开发、产品设计还是网络安全威胁管理,一个团队需要数周或数月才能完成的工作,一个持续运行的人工智能可以在几天或几小时内完成。
Anthropic 的领导层也以类似的措辞谈论了这一进步,其首席执行官达里奥·阿莫迪 (Dario Amodei) 告诉CNBC 的“Squawk Box ”,Claude 的设计预示着未来人工智能将在各个领域建立长期的工作关系。
“你会拥有一个模型,它会与生物化学家进行多年的交流,最终成为法律或国家安全方面的专家。我认为,这种力量将导致不同的模型提供商专注于不同的领域,即使他们制造的基础模型是相同的。”阿莫迪说。
并非所有人都相信无倦怠人工智能即将到来。
Data2 创始人兼首席执行官 Jon Brewton 表示,由于一些隐藏的限制因素,例如内存溢出、累积推理错误、基础设施成本以及脆弱的工具链,AI 代理在处理长时间运行的任务时仍然举步维艰。他把 Claude 目前七小时的工作时间比作看着复印件每复印一遍质量就下降。
布鲁顿表示:“Claude 最近实现了 7 小时的运行,这反映了它在上下文保留、自我纠正和安全监控方面的突破,但要实现 24 小时的运行,需要更便宜、更高效的硬件、更可靠的工作流程以及更智能的信任和治理系统。”
阿莫迪似乎对Claude的想法有所调整,至少在人工智能工作周期的现阶段以及对全面取代人类的担忧方面是如此。
“我希望我们能够达到这样的水平:你只需给人工智能系统布置几个小时的任务——就像你给人类实习生或员工布置的任务一样,”他在接受《金融时报》采访时表示。
来源:老汪说事一点号1