摘要:刘永升:坦白讲,我们并不是看到了什么机会才创业。19 年那会,AI 还没现在那么火。那时候大家鼓吹 "AI 寒冬论 ",当时比较主流的 AI 赛道集中在图像处理的安防、自动驾驶领域。当时我们在腾讯做的 game 方向,算比较小众的领域,但是做出了一点成绩,也就
一个理想的 GAME Agent 是什么样的?
让你分不出来跟你互动的是真人还是 AI。
这是带领腾讯 AI Lab 开发出「绝悟 AI」、「绝艺 AI」的刘永升的回答,他现在的身份是超参数科技创始人、CEO。
在这家专注游戏 AI 和 GAME Agent 的公司的观察里,现在游戏里的 NPC 已经能做到以假乱真。
而 AI NPC 只是 GAME Agent 的可能性之一——
GAME Agent 能够参与到整个游戏管线中,将「智能」带入游戏设计,进一步推动 AI 原生游戏的诞生。
在量子位「365 行 AI 落地方案」中,刘永升和超参数科技将 GAME Agent 的发展划分为了四个维度,现在的超参数已经抵达了 AI Agent3.0 阶段。
我们将这次的直播对话进行了梳理,更多关于 GAME Agent、AI 原生游戏、AI NPC 的内容,让我们一起来看看吧。
对话亮点
我们目前算是从 GAME Agent 的 2.0 走到了 3.0:2.0 主打一个拟人性,3.0 的互动性、自主性、多样性都会更强。
我们之前发现一个挺有趣的点,玩家很多时候会投诉说自己跟很多机器人在玩,但真正去查的话,会发现这些他怀疑的机器人都是真人。
Agent 要体现出有生命的话,主要是要满足两方面:一方面是autonomous(自主性),另一方面是interactivity(可交互)。
我们现在更关心的是 " 智能 " 这个维度,短期记忆或长期记忆、对环境的感知、做哪些动作去改变环境等等,这些东西会成为管线的一部分。
并不是单纯的技术进步给某个行业带来 milestone,而是要和 " 人 ",也就是有想法的团队发生化学反应,才能带来真正不一样的变化。
未来一定会有越来越多 Agent 走进人的生活。
用 AI 来模拟玩家的心流和手感量子位:第一个问题想先从您的经历开始,在 2019 年这个时间点,您是看到并且抓住了什么样的机会选择了创办超参数科技,来为各大游戏公司提供解决方案的?
刘永升:坦白讲,我们并不是看到了什么机会才创业。19 年那会,AI 还没现在那么火。那时候大家鼓吹 "AI 寒冬论 ",当时比较主流的 AI 赛道集中在图像处理的安防、自动驾驶领域。当时我们在腾讯做的 game 方向,算比较小众的领域,但是做出了一点成绩,也就是围棋 AI" 绝艺 "、王者荣耀 AI" 绝悟 "。
正是做这两个项目的过程中,我感觉游戏赛道虽然小众,但比较有意思,能够直接地看到算法的优化、工程技术的优化让 AI 变得更加活灵活现,有递进式的能力的上升。对于我们做 AI 的人来说,及时的 feedback 是非常吸引人的。
我们当时也没想过要给游戏厂商去提供解决方案,单纯觉得这个东西挺有趣的。很早之前就在内部提过一个口号,叫做「AGI in Game」。那个时候 DeepMind 已经在谈 AGI 的概念了,但提的人很少。我们直观的感受是,AI 在游戏里面能够表现得很像真人,「AGI in Game」或许不仅是一个 idea,也是一条路,所以那时候我们就说能不能出来做 AGI。
这也影响到了我们创业的使命——「打造有生命的 AI」,就是想让 GAME Agent 变得越来越有自主性,更具交互性,我们一直在沿着这个方向在走。
量子位:您刚刚提到,最开始就觉得做这件事情很有兴趣,我们也了解到超参数现在也是在做一些 Agent 相关的工作,那到今天超参数为游戏公司提供的服务和合作大致都有哪些方面呢?刘永升:我们出来后发现要考虑柴米油盐,还是需要去做落地。当时比较容易落地的,也比较快被大家接受的,就是给一些大型的 PVP 游戏去提供类似 AI 队友或对手的服务。这是我们最早进行商业化、效果也不错的合作。
后面我们发现在 PVE 中也有不错的应用。PVE 中的 AI 算是一种比较新鲜的东西。以前,大家会觉得 PVE 跟 AI 没什么关系,很长一段时间内我们也是这么认为的。后来我们深入到行业里面,发现 PVE 策划要准备非常多的关卡,特别是一些偏动作类游戏里的 boss 的走位或者动作等,整个制作的代价是非常大的。
在设计阶段,通过跟 AI 的结合,让 AI 训练 AI,让它模拟玩家去闯关、打 boss,可以很好地评估关卡设计得是否合理,是不是能满足策划要的用户心流体验。用户的心流或者手感,是没办法量化的,但是 AI 在这方面可以发挥很大的作用。这是我们和深度合作的游戏团队共同探索出来的。
第三,我们还在做一些 AI+game 相关的探索。目前以一些大型的商业化游戏为主,也在跟一些小体量的 Indie Game 做探索。比如说把我们的 NPC 应用上去,做一个偏动态的世界,需求端看起来很吸引人,但实际上供给端要实现,技术挑战挺大的。
量子位:今天超参数其实是算中国最大的第三方 AI NPC 的供应商了,包括这两年 AI NPC 这个话题也一直很火,为什么 AI NPC 的业务能从游戏业务中独立出来?
刘永升:去年 3 月,我们发布了《活的长安城》demo,里面所呈现的 NPC 的形态吸引了业内的关注,确实不少人来问我们,但说我们是最大的 NPC 供应商还不敢当,感谢大家的认可。因为不管是长期的趋势还是我们自己的规划来看,还有一些关键体验处于技术攻坚期。我们目前算是从 GAME Agent 的 2.0 走到了 3.0:2.0 主打一个拟人性,3.0 的互动性、自主性、多样性都会更强。
为什么 NPC 的业务能够独立出来?
主要是两种情况。第一,一些小体量的游戏跟 NPC 做交互,国内外都有,比如模拟女友交互的,我们内部会把它看成是类似这种斯坦福小镇的变种,体量小的游戏可能在短期内比较容易吸量,但就是后续内容会比较难以为继;第二,大型的平台型游戏,本身体量很大,它会去借助 NPC 这样一个新的体验,结合运营或活动去做一些偏外围的玩法,给玩家一些不一样的体验。
我们做的介乎这两者之间。我们希望能够往前走一步,但不会一开始就去做一个大体量的游戏,毕竟 AI 本身有风险。AI 的风险会加剧游戏的风险,越是大体量的游戏对风险的管控其实是越严格的,它很难去接受当前 AI 带来的一些不确定性。我们做 NPC 还是希望解决一些更中长期的问题,而不是说玩家进来玩了一会就走了这种一波流的东西。
玩家怀疑的机器人,其实是真人
量子位:不同游戏中使用的 AI NPC 技术会有什么区别吗?
刘永升:这里可能存在一个认知上的 gap。我们一直在做 GAME Agent,内部没有 " 不同的游戏品类搞不一样的技术路线 " 的说法,我们一直沿着 GAME Agent 进化的主线在推进和打磨我们的技术。核心依据是 GAME Agent 的主线如何演进。
最早我们的 GAME Agent 只能去理解简单的 2D 场景,比如像棋牌或者其他一些更简单的场景;慢慢地发展到复杂 2D,比如 MOBA;然后再从复杂 2D 到简单的 3D,像现在主流的吃鸡游戏,从环境来看,我们内部会把它归为简单 3D。再后来,它能够适配一些更复杂的 3D 纵深场景,更为复杂。
外界或者客户能够直接感受到的是品类,但我们内部其实是非常清楚坚定地依托 GAME Agent 进化的主轴在做,但在它不同的阶段,我们会结合商业化场景,做一些规则适配或简单规则的改造,去适配不同品类。
量子位:在您的描述当中,其实这个 AI NPC 和我们所理解的 AI 队友或对手,在技术层面上是很像的。那在 AI 队友或者对手这件事上,游戏公司会追求 GAME Agent 更像人类的反应,还是像机器人一样更全面、更高手一些的效果?
刘永升:从过去大部分的落地经验来看,特别是 2020 年到 2023 年,拟人性是很重要的,游戏场景中 GAME Agent 要有更拟人的行为、行为模式、反应甚至是强度,它要接近人。我们之前还做过很多图灵测试,发现一个挺有趣的点,玩家很多时候会投诉说自己跟很多机器人在玩,但真正去查的话,会发现这些他怀疑的机器人都是真人。
尤其是 2024 年之后 AI 发展非常快,玩家对 AI 会有更高的要求。以前你感觉 AI 就是机器人,行为呆板,模式也比较简单。后来拟人性的 AI 出来,玩家感受到了 AI 的进步,那 2024 年之后玩家或游戏方会有更高的要求,会希望 AI 能够带来不一样的体验,不是简单的拟人,而是希望 AI 有更强的互动性,支持多模态交流,有更丰富的行为。
量子位:在技术上,是怎么实现让一个 AI Bot 或者是一个 GAME Agent 更像人类的?
刘永升:Agent 要体现出有生命的话,主要是要满足两方面:一方面是autonomous(自主性),Agent 能根据实际情况和环境做决策,另一方面是interactivity(可交互),它能够跟玩家、跟其他 Agent、跟环境有互动的能力。我觉得得从这两个维度不断提升。
现在大多数 Agent 在 autonomous 方面挺强的,能够在比较复杂的场景下做出非常好的决策。但现在的 AI 在可交互性方面还是偏弱,一些 Agent 只是把简单的语音或视频作为 input 放进去,这些还不够。GAME Agent 在交互方面还有非常多的东西要去推进。
量子位:在您的设想当中,未来的 Agent 有没有具体一个形象?
刘永升:如果有一天你分不出来跟你互动的是真人还是 AI,这可能是一个比较终极的目标吧!其实这个是比较难的,比单纯的对话难,对话现在某种程度上来讲,可以认为是已经通过图灵测试的,但是把互动性考虑进去的话,很多维度的输出以及多种维度输出之间的一致性,挑战很大。
量子位:最终如果所有的 NPC 或者是 Bot 他们都变成很优秀的 Agent,那我们的在线游戏是不是就会变成了 AI 伙伴和人类在虚拟世界中见面?
刘永升:后面会怎么演进,现在还比较难看到终点。我个人,包括跟一些游戏界的一些朋友去聊,觉得大趋势是这样的:现在生活中,手机智能了,汽车智能了,家具也变智能了,什么东西都越来越智能,现在游戏作为一个用户花比较多时间去体验的一个东西,那他也会希望游戏里面的角色或者是一些 NPC 也 " 智能 "。这是一个自然而然的诉求。
这样的话,未来游戏角色跟玩家产生羁绊,就不像之前是通过他的人物设定、精美的建模、吸引人的剧情,而是" 智能 " 这个新维度。因为 Agent 有记忆、能推理,会让玩家的游戏体验完全不一样。这是底层的变化。底层基础能力的增加,上层会迭代出什么样的机制,现在比较难想象,但值得期待。
量子位:AI NPC 中的每一个 NPC 都需要特别定制吗?
刘永升:NPC 本质就是 GAME Agent。NPC 游戏落地的时候,相当于 Agent 智能去分不同的 level,可以简单理解为 NPC 的数量很多,但是不需要每一个的智能 level 都很高。否则,实验成本或是延时各方面很难去支撑。这个是理论和实践之间必然要克服的。
NPC 会分类别、分层级,层级最低的 NPC 是不需要特别花时间的,批量生成就可以,可能会改一些它的设定。重要性高的 NPC 可能就要定制。
量子位:定制化的 NPC 通常会定制它的哪些要素?
刘永升:比如说像人设,交互,这些东西都要有的,我们还会有一些比较独特的东西,比如关系链。我们会重点实现一些 high level 的 NPC 跟其他成员的关系,谁是谁的师傅,是谁的老婆,关系走向……这些会影响到 AI 未来的决策,这些是要去定制的。
未来一定有越来越多 Agent 走进人的生活
量子位:您觉得我们现在推崇的「AI-native Game」和「游戏 +AI」之间的区别是什么?
刘永升:这个定义很难,AI 原生游戏是不是成立,我没办法去给定义和标准。但至少有一个点是可以去探讨,AI 人员是不是深度融入到整个管线里。
以前,AI 同学跟游戏管线没什么介入,游戏项目的 PM 就按照游戏各个模块把时间各方面都安排出来,向前推进,只是到了某个阶段,他把一些需求提出来,让外部的 AI 同学去实现,把这个认为是一个游戏 AI。
但是 AI 游戏的话,可能是 PM 先拆分需求。有些需求,需要 AI 同学交付东西,AI 的交付会限制到下游的安排。我们现在也这么干的,但这样干代价很大,因为 AI 有很多不确定性的东西,给现有的游戏管线和项目管理带来很大挑战。
量子位:您之前有提到说这个 AI 游戏必须要从底层架构来开始发挥作用,制作 AI-native Game 的过程当中,从底层架构开始的第一步是什么?刘永升:以设计角色为例,传统的那一套是考虑它的小传、建模、交互、动作、特效或者剧情。我们现在更关心的是 " 智能 " 这个维度,短期记忆或长期记忆、对环境的感知、做哪些动作去改变环境等等,这些东西会成为管线的一部分。角色越智能,用户越有可能获得更生动、更丰富的体验。
量子位:您认为游戏中是否需要不断提高 NPC 的地位或者说权重呢,应该在哪些方面提高,以及这些方面对于 AI-native Game 来说意味着什么?
刘永升:我觉得这个事情不急,也不见得说就是提高 NPC 的权重。现在很多人会把 AI 游戏跟让 NPC 变得更智能等同起来,但我对这种想法或者概念等同持保留意见。AI 技术出现,让新的玩法或者新的机制出来,这个概率是比较低的,但我认为 AI 跟游戏的结合确实能够带来新的体验。
AI 跟游戏的结合,不是说简单提高了 NPC 的地位。智能的 NPC 是一个元素,好比煮菜,以前可能只有四个原材料,你做出的菜就是这样,现在多了一个原材料,至于你能炒出什么样的菜,那要看厨师的天赋了。
量子位:现在的游戏都是由制作者把控游戏的设计方向。那么如果一个游戏完全由 AI 来生成、主导剧情的话,它是否会提供一些大量的无关信息,使得我们感受这个作品的时候会觉得有点冗杂呢?
刘永升:你这个问题问的非常好。以前很多人问我:" 现在不是有很多武侠小说的文本,未来能不能有一个 AI 技术,只要输入武侠小说的文本,就能够把整个武侠的东西演绎出来。"
我们内部就讨论了这个问题,以《射雕英雄传》为例,很好看,很精彩,情节也非常引人入胜,但是如果用 AI 去模拟仿真出来,天天看到郭靖跟黄蓉做一些很琐碎的事情,这是你想要的射雕英雄传吗?极端一点,洗脸刷牙这种日常琐碎的东西也要吗?很多人去畅想智能 NPC 带来的比较大的变化,就是产生更多的内容。
我们希望从底层能够涌现出有意义的东西。大多数人的想法是 top-down 这样一个结构。top-down 做起来挺累的,资源消耗大,特别是它内容体量做的比较大的时候,维护成本很高,改动或是更新都挺难的。而完全 bottom-up,也基本上不可能带来好看又无穷无尽的内容。完全让 AI 随机模拟仿真的话,它涌现出来内容一定是极其枯燥无聊的。
智能 NPC 要让整个游戏的体验不一样,一定是需要 top-down 跟 bottom-up 更好地结合起来。上层需要策划文案,把握主要的故事情节;关键节点肯定要制定出来。底层有智能的 AI,上层有相对确定的故事框架,AI 可以更好地去演绎。
你不能只给它一个起点,如果只有一个起点,其他所有的东西都乱动的话,其实它完全是无序的。你给他若干个节点,从 A 到 B 到 C 到 D 到 E 到 F,那至于 A 跟 B 之间、B 跟 C 之间,让 AI 去涌现一些随机性,是比较可行的。ABCDEF 条线是否精彩或者引人入胜,还是需要人去保证;在这个过程当中,AI 会起到一定的帮助。
量子位:相当于这样又能够保证游戏可玩,又能通过 AI 提供丰富的内容。
刘永升:上层还是要人参与。如果未来底层的 NPC 能力越来越强的话,相当于他能够去给到上层更大的自由度,上层就能够创造出更复杂的剧情,让跌宕起伏的剧情有了技术支撑。
为什么现在的剧情游戏制作起来很吃力?因为最顶层到最底层都要写得清清楚楚,它都是脚本驱动的。脚本驱动很复杂,机制也很庞大,但当内容叠加很多的时候,它的灵活性就没了。而智能 NPC 能够提供一个大力度的可控的东西。
量子位:让我们回到一个行业的视角,您为什么会觉得游戏会是受生成式 AI 改变最大的行业,AI 在游戏行业的重要性和其他行业相比有什么不同?刘永升:其他行业我也不懂,到现在为止做 GAME Agent 可以较好地让像我们这样的小团队不断迭代。GAME Agent 在游戏场景落地,能不断收集到用户交互反馈,这对我们来说是非常宝贵的,feedback 可以让 AI 不断提升它的可交互性和自主性。我们的周期比较短,而且相对可控,这可以让我们的注意力更加集中在 Agent 本身。
量子位:很多说法是在强调说游戏这个场景里面数据的多样性,数据又多、质量又高,比较适合去训练这种模型。
刘永升:游戏场景确实复杂,我们在实战中就发现在一些复杂场景中 Agent 的应对和表现让人叹为观止,非常了不起,很多东西可能我作为一个人都做不到。这可能也是 AI 技术给游戏和游戏代表的数字世界带来的惊喜吧。
量子位:您在游戏行业这么多年以来,是否有见过或者期待出现什么样的技术,能够在游戏行业中有里程碑一样的效应,让人印象深刻的感觉?
刘永升:虽然我们现在成天跟游戏团队合作,但我们本质上是一家 AI 公司,游戏是我们 Agent 落地的主要场景。回过来说 AI 技术的发展,并不是单纯的技术进步给某个行业带来 milestone,而是要和 " 人 ",也就是有想法的团队发生化学反应,才能带来真正不一样的变化。
颠覆式创新和技术革命出现的概率是比较低的,我们能做到的就是确保实验样本多,这样一来,即使乘以一个比较小的成功概率,好的创新也是有机会出来的。现在还是要前往深水区去做更多探索,之前一些小体量的、简单的尝试,更多是运营向的尝试,后面要往内容和体验这些更为深度的方向去尝试。
量子位:大模型出现以后,搜索行业几乎被彻底改变了。那么您觉得大模型这轮技术的发展,对游戏行业有达到这样巨大的影响吗?
刘永升:首先我不是特别同意大模型彻底改变了搜索这件事,的确很多人会用基于大模型的搜索,但像 Google 这种工具还是能够满足大多数人的大多数日常需求的。
至于大模型对于游戏行业的影响,个人觉得还是要找到结合点慢慢推进吧。AI 对游戏影响的传导也是有一个链路的,首先可能是在一些成功的大体量的商业化游戏中融入一些 AI 特色和调性的东西,用户反馈好以后,有 AI 特色的大体量游戏多了,会逐渐传导到 PC Game、Steam Game。
量子位:今天最后的一个问题,想请您来分享一下站在当下这个节点,您认为未来的 Agent、AI 是朝着什么样的方向发展的,超参数现在是用什么样的方式在这条道路上走的?
刘永升:我们的想法其实一直没变,未来一定会有越来越多 Agent 走进人的生活,就像《星球大战》一样,有各种各样的生物,人形的、机器的、动物的等等和谐共存。现在已经有越来越多的机器狗,未来还会有越来越多的 C 端机器人,GAME Agent 也会走出虚拟环境进入现实世界。
实现的层面,是有一个过程的,我们内部是划分了 4 个阶段,AI Agent1.0 到 AI Agent4.0。
2020 年之前,还是 AI Agent1.0,Agent 主要应用于竞技领域,具备一定的智能水平来参与游戏竞技,但能力相对较为基础和单一。2020 到 2023 年是 AI Agent2.0,AI 的竞技能力和适应性不断提升,并且开始向拟人化方向发展,在游戏中的行为和表现更加接近人类玩家,实现了从 2.5D 到 3D 再到 3.5D 游戏环境的跨越。3.0 就是我们现在这个阶段,拟人性往多样性发展,持续提升自主性和互动性,让 Agent 可以带来差异化、人性化、个性化的体验。
AI Agent4.0 阶段的话,Agent 会是一个虚实结合的状态,GAME Agent 有很大概率从游戏走进现实,最终实现我们一直描绘的 10 亿人跟 100 亿 AI 共同生活的世界。
来源:龙之谷霸主