司晓腾讯集团副总裁 腾讯研究院院长摘要:2025年1月8日,由腾讯研究院和腾讯可持续社会价值事业部主办的“2025 腾讯科技向善创新节 T-WEEK”正式播出。本次创新节以“拟合”为主题,包含近二十场主题演讲与圆桌论坛。
2025年1月8日,由腾讯研究院和腾讯可持续社会价值事业部主办的“2025 腾讯科技向善创新节 T-WEEK”正式播出。本次创新节以“拟合”为主题,包含近二十场主题演讲与圆桌论坛。
腾讯集团副总裁、腾讯研究院院长司晓进行《“拟合”未来:选择比能力更重要》的主题演讲,回顾了人工智能在过去一年取得的进展,以及腾讯研究院的相关应用实践。在分享最后,他回答了这样一个问题:如何让AI与我们的人类社会找到最佳的平衡点?以下为司晓先生演讲全文:大家好,我是腾讯研究院司晓。
过去这一年,我的日常生活越来越离不开人工智能。无论是将AI的应用到工作场景,还是用AI辅导孩子做作业,AI已经从一个“工具”变成了我的助手,甚至某种意义上成为了我的搭档。
说实话,我是一个非典型的文科生,一直对技术很感兴趣,也热爱学习这方面的知识。为了方便自己学习,也给大家节约时间,我们开发了几款跟AI相关的资讯产品。这个过程也像大模型的训练——我们不断用最新的“数据”不断训练自己,获得新的能力和洞察。
首先,我想跟大家分享三款产品的故事。
第一款是“每日AI速递”。“每日AI速递”的目标很简单——每天用3分钟时间,让用户了解AI领域最重要的10条新闻。我们采用了“AI+人工”的生产模式:AI通过插件抓取海量资讯,研究员负责筛选内容、判断价值,最终整理出当天最重要的内容,这比过去纯手工流程快多了。
第二款是“每周关键词”。在“每日AI速递”的基础上,我们推出了“每周关键词”。我们会梳理出一周的热点关键词,比如“生成式AI”或“多模态技术”,并制作一个可以点击跳转的索引,方便读者快速获取相关信息。通过这个产品,你可以通过点击关键词,一键跳转到上一周发布的每日动态新闻页的具体位置,这样的体验在公众号生态里是不多见的。最初,这项工作需要实习生手动整理、标注,但后来我们用AI生成了一个自动化工具,不仅提高了效率,还大幅减少了重复劳动,这样团队可以把更多精力放在内容优化上。
第三款是“科技九宫格”。为了让科技资讯更加直观,进一步降低门槛和提升体验,我们推出了一档短视频栏目“科技九宫格”。它以3-5分钟的短视频解读近期的科技热点和关键技术原理。制作过程中,我们大量使用了AI:从头脑风暴、提纲梳理到文案初稿,甚至每一期的封面图都是AI生成的。但最终的脚本打磨和视频剪辑,还是由我们团队完成,以确保内容的准确性和品质。通过这些产品的探索,我越来越发现,AI对我们日常工作的提效还是很明显的。但与此同时,我们也能看到AI目前的局限性,在这里,“选择”就显得尤为重要:选择如何和AI协作,选择哪些地方需要人力的判断,选择什么时候放手交给AI。可以说,在这个时代,“选择比能力更重要”。刚才聊了产品,现在让我们放眼整个行业。今年是AI技术大爆发的一年,大家有没有这种感觉?无论是语音助手还是图像生成,AI几乎每天都有新进展。而2024年最值得一提的,我感觉主要是以下三大方向。第一,多模态能力爆发式增强。什么意思呢?简单来说,以前的AI擅长处理文字,比如写文章、翻译语言,而现在,它已经能同时处理文字、语音、图片、视频,甚至3D模型,能力可以说是全方位的进化。比如,今年上半年,OpenAI发布了多模态大模型GPT-4o,不仅可以进行端到端的语音通话,甚至模仿你的说话风格和情感语气。你跟它对话时,会感觉它就像一个真人,能听懂你话里的细腻情感,甚至回应得恰到好处。在连续12天的OpenAI发布会上还推出了视觉理解的功能,摄像头成为了AI的眼睛,能通过摄像头对现实世界进行实时理解。由此带来的交互就更加有意思,比如我们看到发布会里,GPT通过手机摄像头对着你,教你怎么样去泡一杯咖啡,也可以跟它去玩一个游戏,比如三个空杯子里只有一个球,让它猜这个球在哪儿。我自己第一时间的一个实验,拿它对着办公室的飘窗,上面摆了几个公仔,我问它有几个公仔、分别是什么?最开始它只发现了两个公仔,但后面我提醒它:你有没有发现枕头背后其实还可能有一个公仔。经过我的提醒,它做了一个推测,它说确实可能还有一个有着兔子耳朵的公仔。你会发现,现在你跟AI的交互确实很像人和人之间的交互。这比文字交互式更有意思的,也能让我们直观感受到AGI时代的加速到来。甚至你会有一种错觉,科幻电影《她》里的智能助手,已经真实地走入到我们的生活场景里了。
更厉害的是,AI生成视频的能力也在突飞猛进。今年腾讯发布了混元文生视频大模型,130亿个参数,而且是开源工具。这个工具能把简单的文字描述,直接生成成一段高质量的视频。比如,你输入“夕阳下,一条河流蜿蜒在山谷中,两岸开满了金黄色的野花”,它就能生成一段以假乱真的视频,效果逼真到你以为是电影里的画面。对于普通用户来说,这种技术大大降低了制作门槛,或者说赋予你一种专业级的影视制作能力。过去需要专业团队花几个月才能完成的视频,现在可能只需要几行文字加一台电脑,甚至一部手机就能搞定。
这让我想到,2027年春节,《流浪地球3》即将上映。大家想一想,以目前AI能力进化的速度,这部电影上映之前,民间会出现多少高质量的“山寨版本”?这些可能都不是专业团队的作品,但也能达到很高的水准。这意味着未来,我们每个人在AI的赋能之下,都有可能成为专业的“电影制片人”,甚至是“科幻大片导演”。
多模态输出能力的提升,把稍微有点冷下来的概念“元宇宙”推向一个新的高度。今年,腾讯推出了一款古代城市生成工具Ancient Cities。通过程序化生成技术,它可以快速构建一座规模宏大的古代城市,比如从无到有建立一个数字秦代咸阳城。整个过程分三步:
第一步是迭代建筑布局,用曲线定义街道和小巷大致形状。
第二步程序化生成大量内容,包括建筑、行人和马车等小物件。最后是打磨阶段。过去,美术团队需要几百个工作日才能完成的场景,现在用几十个工作日就能搞定。这对影视、游戏甚至文旅行业都有可能带来非常颠覆性的变化。
第二,AI推理能力显著增强。
说到AI的推理能力,之前人们都会质疑,AI到底能不能理解你输入的文字,AI到底能不能像人一样“动脑筋”?其实,AI不仅能动脑筋,还能在非常复杂的语境下,面对复杂的逻辑推理问题,给出准确的答案。比如今年,OpenAI推出了全新的o1模型,它不再只是像以往的AI那样“直接给答案”,而是能模拟人的“慢思考”的过程,分析复杂问题背后的逻辑关系。
这让我想到一个很有趣的类比:如果说传统AI像快思考(系统1),擅长快速反应和直觉判断,那么o1模型更像慢思考(系统2),会花更多时间分析背景、挖掘细节。如果你观察它的每一步,它会展开每一步的细节,甚至会复盘、校正,最终把整个思考推理的过程都呈现出来,这非常像人类一边在思考一遍在回答的过程。
这种能力在教育领域特别有用。比如,o1在STEM(科学、技术、工程、数学)教育中的表现尤为突出。想象一下,当你向AI提问一道物理题时,它不仅告诉你答案,还会一步步推导过程,解释每一个关键点。这种“教学式回答”特别适合逻辑性强的领域,比如编程、数学解题等,帮助学生真正理解背后的原理。
不仅如此,AI推理能力的提升也在科学领域发挥了巨大作用,也就是我们现在常说到的,AI for Science。今年诺贝尔物理学奖就授予了两位与AI研究密切相关的科学家:约翰·霍普菲尔德和杰弗里·辛顿,以表彰他们在人工神经网络和机器学习方面的突破性贡献。而诺贝尔化学奖则因为AI在蛋白质结构预测和分子设计方面的应用,颁给了大卫·贝克团队以及DeepMind的研究者们。现在看来,AI不仅仅是一个“计算工具”,它还可以在科学研究中担任“助手”,或者说担任“半个科学家”的角色。它能够生成假设、优化实验参数、穷举复杂变量,甚至帮助研究人员分析结果。这意味着未来的科学家可能不再是单枪匹马,而是有了AI这样的“研究搭档”,一起推动科学发现的边界。第三,AI对个人的赋能进一步提升。有人说scalling law到头了,但现阶段,多数人对大模型能力(应用开发)使用不足1%,所以AI对个人的赋能还是刚刚开始。你用的大模型和别人用的可能是一个,但是用大模型生成的内容可能不是一个level的。可以说,未来正在到来,但并非均匀降临。其实,AI不仅是团队的好帮手,也正在成为“超级个体”的加速器。它可以帮助我们每个人完成更多、更高效的工作,还能拓展我们的思维边界,形成Co-Intelligence(协同智能)。比如在内容创作中,AI的表现让人惊艳。无论是写作、绘画还是视频制作,AI都能让创作者更快、更好地实现自己的想法。你甚至可以让AI模仿你的风格,生成符合你个人品牌的内容,甚至帮助你跳出固有思维。举个例子,想象你是一位作家,你可以让AI生成一个“美国版的你”或“非洲版的你”的作品,帮助你从完全不同的文化视角审视同一主题。更有意思的是,AI正在从单纯的工具,变得更像一个有情感的伙伴。今年,长文本生成、情感模态感知等技术进一步完善,让AI可以更自然地理解我们的表达习惯和情感反馈。比如,当你和AI讨论一个购物决策时,它不仅能分析价格和性能,还会根据你的偏好给出建议,甚至提醒你的消费决策是否符合你的长期目标。这种“懂你”的感觉,让AI从冷冰冰的工具变成了一个有温度的助手。但更深层次的意义是,AI正在帮助我们重新认识自己。它可以让我们反思自己的局限,甚至突破我们以往看问题的方式。比如,你可以问AI:“如果我是一个完全不考虑风险的人,这个决策会怎么样?”这样它就会解开束缚,会从另一个视角帮你分析可能的结果。这种能力,对于复杂的思考和决策来说,帮助非常大。聊到这里,我们会发现,当AI能力越来越强时,一个核心问题浮现了出来:如何让AI与我们的人类社会找到最佳的平衡点?这就是我们今天大会的主题:“拟合”。“拟合”是数据科学领域中的一个专有名词,指的是一个模型尽量贴合数据的过程。如果模型太简单,那叫“欠拟合”,它无法抓住重点;而如果模型太复杂,甚至把噪音也当成了信息,那就是“过拟合”。我们可以把这个拟合的过程比作穿衣服。欠拟合就像衣服太松,穿上去不合身;过拟合则像衣服太紧,让人不舒服。只有适度拟合,衣服穿起来才最舒适。那么,这种“拟合”的概念放在人类和AI的关系上也非常贴切。我们既不能对AI置之不理,也不能完全依赖它,而是要找到一个适度的“拟合点”。具体来说,我认为拟合有三个方向特别重要:一是,个人与AI的拟合:学会用AI提升效率,但不要放弃独立思考的能力。比如,不要完全依赖AI生成内容,而是要在内容打磨上保留自己的判断和创意。比如,过去一年,我基本用大模型来替代搜索,但也不敢完全信任,有时还是会回到搜索引擎和查证准确性。二是,经济与AI的拟合:推动AI技术创新的同时,也要关注就业和社会的稳定。比如,用AI提高生产效率的同时,也要投入更多资源进行员工技能培训,要注意全员在人工智能时代的数字素养。三是,社会与AI的拟合:确保技术的覆盖面更广,特别是关注弱势群体的需求。今年腾讯研究院做了一项调研,发现年轻人热衷于和AI聊天甚至恋爱,但老年人对现有的AI产品满意度很低。这很可能是因为技术设计由于各种原因没有考虑到老年群体的特殊需求。为了解决这个问题,我们启动了“AI向善语料库”项目,希望通过开源共建的方式,让社工团队、养老院的专业群体参与到优质问答的生产上,共同做AI的训练,使大模型的输出更有人情味,让比如老年人、残障人士等更多特殊需求人群也能享受到技术的红利。比如,我们会引入更多照顾老年人使用习惯的语料,让AI产品更友好、更有温度。需要强调的是,“拟合”不是一劳永逸的,它是一个动态调整的过程。随着数据、需求和技术的变化,我们要不断寻找AI与社会的最佳平衡点。马丁·路德·金在《我有一个梦想》的演讲中所说,“我有一个梦想,那就是有一天,我们的孩子们将不再被他们的肤色所定义,而是被他们的品格所定义。”在人工智能时代,这个格言也许可以这样改写:“我有一个梦想,那就是有一天,我们的世界将不再被我们的技术所定义,而是被我们的人性所定义。”在这样一个转折点上,我们不仅是历史的见证者,也是未来的参与者。科技向善的背后,是我们每个人都需要做出向善的选择,才有可能共同拟合出一个更好的未来。来源:晓加科技观