这场特别的思想实验何以“骗过”四成观众

B站影视 内地电影 2025-08-25 09:14 2

摘要:“如果能一键消除所有痛苦回忆,要不要按?”大屏幕上,两名外貌相同、服饰相同的辩手围绕涉及情感、伦理、心理学、哲学等领域议题展开激辩。背后,一方是真人辩手武汉大学教师陈铭,另一方来自上海企业MiniMax提供的大模型。

《2025中国·AI盛典》辩论现场。 (总台供图)

“如果能一键消除所有痛苦回忆,要不要按?”大屏幕上,两名外貌相同、服饰相同的辩手围绕涉及情感、伦理、心理学、哲学等领域议题展开激辩。背后,一方是真人辩手武汉大学教师陈铭,另一方来自上海企业MiniMax提供的大模型。

日前,中央广播电视总台《2025中国·AI盛典》在上海举行。盛典中的赛后投票,42%的观众把大模型认作人类。图灵测试是衡量机器是否具备人类智能水平的经典标准,由被誉为“人工智能之父”的图灵在1950年提出:如果一台机器在自然语言对话的过程中能“骗过”超过30%的人类参与者,就可以被视作具有智能。如今,来自上海的国产大模型MiniMax在人机辩论“图灵测试”中以远超30%的“人类认同率”通过测试。这是国内大模型首次通过人机辩论“图灵测试”,标志着我国在AI自然语言理解和逻辑思维方面取得重大进展,也展现了上海作为全球人工智能高地的创新实力。这场特别的思想实验,不仅让观众惊叹于AI的辩论能力,更引发广泛好奇:一场颠覆传统的测试究竟如何诞生?

从“胜负导向”到“相AI相生”

据介绍,《2025中国·AI盛典》最初计划打造一场以胜负为导向的人机辩论赛,让直观的输赢结果展现AI的能力。然而,AI辩手在彩排中的表现远超预期。它能快速检索知识库,调用语言模型与逻辑推理规则,输出条理清晰、情绪饱满的观点,整个过程行云流水,响应速度甚至快于人类思考的时间阈值。

“当AI的辩论水平足以同人类辩手分庭抗礼,简单的胜负反而显得狭隘。”节目组意识到,真正的价值在于呈现两种智能如何相互激发、优势互补。正是这种认知的跃升,让节目最终超越了竞技对抗,成为一场探讨“相AI相生”时代命题的深度思想实验,以彰显人机协同发展的无限可能。

不单纯判定胜负,而是以辩论形式呈现思考过程,节目组透露两层考量——技术层面,辩论是多维度智能的“高阶考场”,它不仅要求语言流畅,更考验深度理解、即时反应、知识整合与策略博弈;传播层面,辩论天然具备戏剧张力,正反双方的针锋相对让抽象的智能评测变得可视、可感、可评。

创意一经确定,一支顶尖智囊团迅速集结:中国工程院院士、之江实验室主任王坚,清华大学心理与认知科学系主任、北京智源人工智能研究院首席科学家刘嘉,复旦大学特聘教授、上海科学智能研究院院长漆远,人工智能学者、工学博士高庆一,以及辩手陈铭。数轮“头脑风暴”后,辩题锁定在两个颇具哲学张力的议题——“按下一个按钮可以删除痛苦的回忆,该不该按?”与“AI会不会真的爱上人类?”前者因其直指人类敏感的情感神经,更能展现人机思维的互补性与差异性,被选定为测试的核心议题。

人类对智能的探索,只是开始

“骗过”42%观众,AI辩手的“首次突破”并非偶然。据了解,作为以线性注意力混合架构(文本模型)为骨、实时语音生成(多模态模型)为翼的智能体,MiniMax多模态大模型学习了万亿条人类数据,拥有4560亿参数,单次激活459亿参数生成智能响应。它在多个基准测试中取得出色成绩,具备强大的数学推理、复杂的问题求解,以及长文本处理能力。

具体到辩论现场,这位AI“辩手”表现亮点颇多。尤其是当它说出“(按钮)赋予人们在绝望中重新选择的力量,不是为了逃避,而是为了重生”时,观众感受到的不是冰冷代码,而是一种超越算法的情感共鸣。

在图灵提出经典设想的75年后,进行一场人机辩论“图灵测试”意义何在?

“测试中AI展现出的辩证思维能力和即时反应速度,证明我国在自然语言处理和认知智能领域已经达到国际领先水平。”漆远认为,“这场测试既验证了技术突破,又引发了公众对智能本质的思考。这正是科研与科普的完美结合,为人工智能的健康发展提供了示范。”而在王坚看来,此次“图灵测试”的意义,超越了简单的“辨别人机”。他表示:“当年的图灵测试为人工智能定了一个极具挑战的目标,70多年后我们做到了,就像大家今天看到的一样。但这也同时让我们看到通过了图灵测试只是人工智能的下一个新的开始,远不是终结,而这是图灵本人也没有预想到的,下面70年会是人工智能更令人激动的时代!”

“AI通过图灵测试并非标志人类对智能的探索的结束;相反,这一切只是开始。”刘嘉说,就像牛顿力学无法解释微观世界的量子现象一样,旧框架已不足以衡量新智能的维度。如果未来AI能稳定通过图灵测试,那么“智能”的定义需要新的内涵,例如创造力和自我意识。

来源:济南时报-新黄河一点号

相关推荐