记忆力成为大模型竞争新赛道,更博闻强记的大模型有何优势与风险?

B站影视 内地电影 2025-04-11 19:11 1

摘要:据中央广播电视总台经济之声《环球新财讯》报道,除了拼训练参数、拼成本,大模型又找到了新的赛道,那就是拼记忆力。全球多款通用大模型的记忆力最近都显著提升,有的甚至可以调用用户之前所有对话内容。大模型拥有更强的记忆力有什么用途,又有哪些潜在风险?

央广网北京4月11日消息(记者吕红桥)据中央广播电视总台经济之声《环球新财讯》报道,除了拼训练参数、拼成本,大模型又找到了新的赛道,那就是拼记忆力。全球多款通用大模型的记忆力最近都显著提升,有的甚至可以调用用户之前所有对话内容。大模型拥有更强的记忆力有什么用途,又有哪些潜在风险?

记忆力是大模型回忆上下文的能力。不少用户以前都有这样的感受:大模型好像有“健忘症”一样,每次聊天和输入问题,它都会把用户当成“陌生人”。而最近,大模型的记忆力突飞猛进。OpenAI首席执行官Sam Altman最新发文表示,大幅提升了ChatGPT的记忆能力,它现在可以调用用户之前所有对话内容。在这之前,Meta发布的Llama 4系列模型把记忆力作为主要参数和亮点之一。而我国的DeepSeek也早就有了短期记忆功能。可以说,和训练参数、训练成本一样,记忆力也成了大模型的核心竞争力。

清华大学新闻学院和人工智能学院双聘教授沈阳介绍,大模型提升了记忆功能之后,能有效提高人机交互、人机协同和人机共生能力,更精准和个性化地输出内容。

沈阳说:“让AI具有比较长程的记忆功能这肯定是好事。比如说做工程,我们可以给若干个项目做记忆编码,然后我在做这个事情的时候,就有一个记忆链条。这样的话,生成出来的内容会具有更高的针对性,有更好的精准度,当然对人来说有更好的效率。”

目前,一些大模型在回应用户指令的时候,已经能根据之前的提问作出猜想,这让用户感觉智能程度指数级跃升。早前的一项调查显示,大模型记忆力越强,越能对特定问题给出准确回答。有人甚至预测,在人机交互数据足够多的情况下,大模型甚至能掌握用户的习惯,以用户的口吻说话,以用户的思维思考问题,生成用户真正的“数字分身”。

不过,用户对大模型安全的担忧也相应增加。北京邮电大学互联网治理与法律研究中心主任谢永江就从大模型的记忆力提升中看到了风险。

谢永江说:“从现在的技术发展趋势来看,数据如果被滥用了,或者被泄露了,给你塑造一个‘第二人身’数字人风险的确还是非常大的,为黑色产业链的精准诈骗以及一些精准犯罪活动提供了很好的技术支撑。所以我觉得还是特别要警惕,而且应该是在要确保安全的情况下,才去考虑提供更好的服务。”

沈阳同时指出,当前,大模型的记忆力还明显与人类不同。人脑在记忆的同时,也有遗忘功能,而大模型在没有用户手动干预的情况下则会记住一切。这在增加信息泄露风险的同时,也可能会出现记忆紊乱。

沈阳说:“AI还不能100%准确辨别需要记忆的东西,比如说我有时候会做一个角色假定,我会问AI假定我是一个18岁的小伙子会怎么样?它也有可能误以为我真的就是18岁小伙子,所以它会某种程度上出现一种记忆冲突的情况,这些我想都需要在AI发展进程当中逐步予以解决。”

随着人工智能技术的进步,AI安全、AI伦理、AI治理关注度不断升高。早在两年前,全球1000多名人工智能专家、科技人员、产业高层就曾呼吁暂停研发比GPT-4更强大的人工智能系统至少6个月。中国科学院研究员曾毅表示,最新研究证明,人工智能发展应用和安全之间不是相互掣肘的关系,但他仍然建议,要在充分预判和应对风险的基础上,应用大模型技术。

曾毅说:“现在的人工智能大模型并没有把所有人工智能已知风险都解决,就上线进行服务了。所以就需要把进行风险标准化处理作为第一步。但是对于不可预知风险、未知风险,仍然需要积极进行战略性预判和研判,用技术的手段‘以技制技’,用技术人工智能的技术去防范可能的人工智能风险。”

更多精彩资讯请在应用市场下载“央广网”客户端。欢迎提供新闻线索,24小时报料热线400-800-0088;消费者也可通过央广网“啄木鸟消费者投诉平台”线上投诉。版权声明:本文章版权归属央广网所有,未经授权不得转载。转载请联系:cnrbanquan@cnr.cn,不尊重原创的行为我们将追究责任。

来源:央广网

相关推荐