摘要:早在2012年,李彦宏就鼓励百度产品经理了解AI的最新趋势。同年,百度在一场秘密拍卖中,向DNNResearch开出了1200万美元的高价,展现了李彦宏对AI的坚定决心。
作者 | 石头城平凡的鱼仔
在AI技术飞速发展的今天,李彦宏再次以其独到的见解,为AI热潮提供了冷静的视角。
过去两年,AI大模型技术以惊人的速度迭代创新,从企业巨头到创业者,再到风险投资,都在积极探索基于大模型的新一代应用。
“但实事求是地说,我们期待的革命性应用尚未出现,有人甚至质疑,这24个月的全球大模型热潮,是技术革命还是泡沫?”
在2024年百度世界大会上,百度的掌舵人李彦宏开场便提出了这一尖锐问题。
在AI大模型的风云变幻中,行业始终被超级应用的焦虑所笼罩。李彦宏却以其“清醒发言”脱颖而出,他曾提醒业界:“不要只关注模型,更要关注应用。”
当业界都在讨论大模型系统的开源优势时,李彦宏却强调闭源大模型的商业潜力。
在行业的喧嚣中,李彦宏始终保持冷静和深思,这源于他在AI领域的长期主义和“领先半步”的洞察力。
长期以来,李彦宏一直是全球AI领域的坚定信仰者。2023年,《时代》周刊评选他为全球AI领袖,与马斯克、黄仁勋等并列。
《时代》评价他为:“中国最杰出的未来主义者,长期致力于AI的发展。”
在AI尚无明确路径时,李彦宏就呼吁全社会投入和关注AI。他对AI的热情始于学生时代,即使外界质疑不断,他依然坚持成为中国AI的先行者。
杨立昆在《科学之路》中提到:“百度是最早部署商业化深度学习系统的大型公司之一,领先于谷歌和微软。”
早在2012年,李彦宏就鼓励百度产品经理了解AI的最新趋势。同年,百度在一场秘密拍卖中,向DNNResearch开出了1200万美元的高价,展现了李彦宏对AI的坚定决心。
次年,百度深度学习研究院成立,成为全球首家以深度学习命名的研究院,为AI行业培养了数千名人才。
在2015年的海南博鳌论坛上,李彦宏作为主持人,提出了他对人工智能的看法。当时,移动互联网的浪潮尚未结束,人们就开始好奇下一个浪潮是否是AI。
面对李彦宏的提问,马斯克改变了之前对AI的负面看法,认为应该通过互联网建立AI,同时注意安全性。这次早餐会上,原本期待的“AI激辩”并未发生。
但在三人对谈的9个月后,OpenAI成立,马斯克担任联合董事长,并承诺提供10亿美元资金。微软也在OpenAI投资了一百多亿美元,获得了技术使用权。
· 01 ·
科技巨头在AI领域的竞争往往在幕后早已布局。
2022年底,OpenAI发布了Chatgpt,引发了公众对AI的热烈讨论。随后,百度发布了文心一言,谷歌发布了Bard,更名为Gemini。芯片厂商和云服务商如英伟达和微软也从中受益,开源模型紧随其后。
百度再次成为焦点。人们意识到,李彦宏对AI的押注并非空谈。过去10年,作为全国政协委员,李彦宏连续8年提出13份AI相关提案。在2016年AI大潮中,他在公开场合提到“AI”500多次。他对AI的科普不遗余力。
在李彦宏的带领下,百度已转型为拥有强大互联网用户基础的AI生态型公司,在深度学习、对话式AI操作系统、自动驾驶等领域深度布局。
在大模型的喧嚣中,李彦宏始终保持冷静,关注AI应用的实际场景。他强调,应专注于AI应用。
在与哈佛商业评论英文版总编辑的对话中,李彦宏表示,AI泡沫难以避免,但基于用户需求的应用能推动AI的创新和发展,降低“伪创新”比例,提升企业生存机会。成为1%的AI企业,能让AI技术走得更远。“现在,行业比去年更冷静,也更健康。”
这一判断与全球AI巨头的选择相呼应。微软推出了AI助手Copliot,直接集成到Microsoft 365中,扮演“协作者”角色。Perplexity.ai则基于AI聊天构建搜索引擎,提供简洁、准确的回答。
微软Copilot和Perplexity.ai指向了AI技术向应用落地的转型。这种转型意味着,更务实、更关注用户需求的AI技术,才能成为日常生产生活的一部分。
李彦宏预测,下一步的方向是大模型的应用。他用移动互联网时代来类比模型和应用,如iOS和安卓系统。
在“欧洲科技创新展览会”上,李彦宏提到了22次“应用”。阳狮集团监事会主席莫里斯·列维表示,人工智能领域的两大主导力量是美国和中国。
在这场大模型风暴中,中国无疑是最受关注的技术变革中心之一。世界的目光聚焦在李彦宏身上,不仅因为他是大会唯一受邀的中国企业家,更因为他是“长期的AI支持者”和“中国AI头号玩家”。
在百度世界2024大会上,李彦宏带来了关于AI应用的最新判断。他表示:“我们不是要推出一个‘超级应用’,而是要帮助更多人、更多企业打造出数百万‘超级有用’的应用。”
大会发布了iRAG、无代码工具“秒哒”两大AI技术,展示了百度以大模型为基础,以应用为核心的“超级有用”生态,宣布“AI应用的群星闪耀时刻已然到来”。
李彦宏的信心并非没有根据。今年5月,文心大模型日均调用量达到两亿时,他曾讨论,如果一年内涨10倍,涨到20亿,“我认为就成了,就说明大家是真需要”。仅仅半年过去,这个数字就达到15亿,增长至7.5倍,这条陡峭的增长曲线成了他的底气。
· 02 ·
百度发布两大“超级有用”技术
AI“超级有用”正在成为现实。李彦宏带来两大变革技术。
第一大“超级有用”技术是检索增强的文生图技术iRAG,iRAG看似基础,却直戳痛点。超级有用的关键在于“有用”,用科技让复杂的世界更简单。过去一两年,当整个中文互联网都为Sora捶胸顿足时,百度却在潜心解决图像生成的幻觉问题,简单来说,就是文生图“一眼假”的问题。比如北京天坛的照片,真正的天坛是3层建筑,AI却能凭空多出一层,iRAG要解决的正是这类痛点。
过去两年,大模型在文本上的幻觉已经基本被解决,但图像等多模态内容和RAG的结合还不够。
而iRAG可以让文生图变得无幻觉、超真实、没成本,而且立等可取。这样的功能在影视作品、漫画作品、连续画本、海报制作等很多领域,都可以有广泛的应用空间。比如在品牌宣传场景,以前拍一组汽车在某场景的大片宣传海报动辄需要一二十万元,甚至大几十万元,如果运用iRAG,创作的成本就会接近于0,商业价值潜力巨大。
每日人物试着输入“帮我画一张马斯克和一只迅猛龙在后备箱里剥豆角”让AI作画,很快屏幕上就出现了一张马斯克笑容可掬地剥豆角,与体型相当的迅猛龙在后备箱和谐共处的图片,马斯克是那个马斯克,剥豆角的手指也没有无缘无故地多或是少。
第二大“超级有用”技术则显得更为炫酷,“人人都可以是程序员”理想照进现实。李彦宏发布了无代码产品“秒哒”,并称其为“迄今为止人类历史上最复杂的多智能体协作工具”。
李彦宏现场演示如何借助秒哒完成百度智能驾驶产品“萝卜快跑”的发布会电子邀请函。简单的指令召唤出0号智能体,它负责规划调度,将这个任务拆解成了需求确定、内容生产、工程开发三个步骤。接下来,0号智能体依次召唤出策划、程序员等多个智能体完成图片设计、写代码、文案产出等工作,最终产出了一个完备的线上邀请系统。“从你开始到最后结束,只需要3分钟,用户不用写一行代码,甚至完全不用看得懂代码,就可以完成。”
直播的实时弹幕中,网友惊呼“这也太牛了吧,震惊”“人工智能技术造福广大普通人” “AI应用的时代是真的来了”。李彦宏宣布,“秒哒”将于明年第一季度发布,现在就可以去排队预约,参与内测。
“AI之所以被称为产业革命级的机会,就是因为它对于社会经济,带来了生产力的无限扩张。”早在今年年初,李彦宏就预言过“未来10年,人人都将拥有程序员的能力”的时代很快来临,这一预判也和用英伟达创始人黄仁勋的想法不谋而合。黄仁勋曾在2024年世界政府峰会上表示,“我们的工作是创造计算技术,使得没有人需要(传统意义上的)‘编程’,让世界上的每个人都成为程序员。”
李彦宏展望,随着秒哒技术的进阶,未来人们不需要去招募项目经理、设计人员、开发人员、测试人员等,自己就可以指挥多个智能体来协同完成任务。“只要有想法,你就可以心想事成,我们将迎来一个前所未有的只靠想法就能赚钱的时代。”
· 03 ·
百度的AI应用生态
“基础模型能力就绪,我们即将迎来AI应用的群星闪耀时刻。每一个应用都是一颗星,每一个应用都将成为改变世界的力量。”
得益于百度文心大模型和百度生态的丰富应用场景,目前,百度已经在智能体和产业应用两大方向上跑出商业通路,形成AI领域的“超级有用”生态。
大模型如何在产业落地,如何为千行百业的企业创造增量价值,这是百度一直在探索的问题。李彦宏介绍,过去这一年半左右,百度在金融、能源、教育、招聘、公共服务等各个领域,大模型跟场景结合后,在降本和增效两个方面都取得了实实在在的成果。
百度智能云是百度构建智能产业生态的主要依托。目前在百度智能云的千帆大模型平台上,已经累计帮助用户精调了3.3万个大模型,开发出了77万个企业级应用,百度智能云已经拥有中国最大的大模型产业落地规模,60%的央国企以及大量的民营企业,都在联合百度智能云进行AI创新。
比如招聘企业智联招聘利用大模型重构了“把合适的人匹配到合适的岗位上”这个核心环节。AI还能自动回答有关工作时长、薪资福利、工作地点这些求职者关心的问题,甚至进一步帮助安排面试。“人岗匹配的平均准确率高达93%,而大模型使用的成本却下降了约90%。”还有蔚来汽车基于文心大模型打造出了端云协同多模态大模型——NOMI GPT,目前NOMI已经陪伴了近20万车友家庭。
百度世界大会2024现场,全红婵、陈芋汐、曹缘等跳水冠军亮相引起轰动。大家只知道国家队一线备战训练的刻苦,跳水队巴黎奥运包揽奥运8金的好成绩,没想到体育竞技背后还有AI技术的较量。
据介绍,百度AI为我国跳水队打造了首个智能辅助训练系统。配备这套系统相当于有了“火眼金睛”和“最强大脑”,能够捕捉高速跳水动作的任一细节,实现快速分析、对比、实时打分,可以在训练前熟悉动作,也可以在训练后分析并形成改进方案。全红婵在现场都说,“我感觉帮助挺大,这套(AI)系统可以多角度还原我的动作,同时也会和之前的动作对比,帮我把动作做得更好,真是太全面了!”
除了产业应用,李彦宏认为:“智能体是AI应用的最主流形态,即将迎来它的爆发点。”这种判断,一样在比尔盖茨、扎克伯格、吴恩达等科技巨头的想法中找到了呼应。去年11月,比尔·盖茨在个人网站撰文,阐述了智能体(agent)在未来几年如何颠覆我们使用计算机的方式。在他的设想中,智能体会成为每个人的私人助理,人们“不必为不同的任务使用不同的应用程序,只需使用日常语言告诉设备你想做什么”。而今年7月,扎克伯格也在一次采访中直接预测,未来智能体的数量可能会达到数十亿,甚至超过全球人口总数。
全球所有顶尖科技公司都很关注智能体,“但像百度这样把智能体作为最重要战略方向的并不多”。李彦宏认为,做智能体很像在PC时代做网站,或者是移动时代做自媒体账号。不同之处是智能体更像人,更智能,更像你的销售、客服、助理。智能体可能会变成AI原生时代内容、信息和服务的新载体。
他现场展示了4种不同类型的智能体的应用,包括公司类智能体,角色类智能体,工具类智能体和行业类智能体。
在百度搜索“比亚迪”,就能直接唤起它的官方智能体。点击进入,它会首先给你一段比亚迪品牌的简短介绍,类似于传统的官网。然后,你可以让它推荐一台“性能均衡”的车型,智能体能准确理解“性能均衡”的含义,并把你感兴趣的多个车型的动力类型、车身尺寸、续航、加速性能放在一起拉出表格来,直观呈现。
“比亚迪的官方智能体上线后,销售线索转化率提升了119%。”未来,公司官方智能体将成为最直接的面向消费者的界面。
第二类,角色智能体。提到角色,大家很容易想到数字人。数字人有自己的人设、自己的知识库,这都是典型的智能体基本要素。
在百度搜索“教育辅导”这样的关键字,就能看到这些数字人。他们不仅比我们以前看到的数字人更加自然、动作幅度更大,甚至在直播场景下,还可以说着说着,在合适的时机停下,回复网友现场提出的问题。“这需要大量的数据积累和直播互动规律的总结提炼,以前,我们是不具备这样的能力。所以今天的数字人直播,很多情况下,转化率已经超过了真人。”
· 04 ·
李彦宏认为,真人与虚拟人的交互,将创造巨大的产业价值和社会价值。这里的虚拟人,可能就是现实生活中的一位名师的数字分身,也可能是一位名医、王牌律师和金牌销售的数字分身,而你从来没有像现在这样离他们如此之近。
李彦宏还在现场发布了一个全新的工具类智能体,由百度文库和网盘联合开发的“自由画布”。相比过去单一的产品,它充分运用了文库与网盘的融合优势,全面打通过去公域与私域资料的限制,让输入、编辑、创作和分享的自由相比过去更上一层次。简单来说,自由画布就是一个由文心多模态大模型加持的万能白板,它能很好地激发人们的无限灵感和创造力。借助自由画布,每个人都可以是漫画家、成为短视频导演。
如今,智能体已经不仅仅是一个冰冷的技术名词,而是温暖的生活助手和每个人的创意展示平台。无论什么年龄段和学历层次,无论是小学生还是博士生,都可能在“人人可开发”的宗旨下创建独属于自己的智能体。百度智能体开发大赛中,11岁的小学生朵朵就融合自己的成长经历创建了一个“青春期成长小导师”的智能体,希望帮助青春期朋友应对身体和思想的种种变化,缓解情绪问题。
法律、医疗健康、金融、体育、旅行等等领域,也涌现出了各类有用的行业智能体。百度打造的法律行业智能体法行宝,创建至今已经累计回答用户1660万个法律问题。如果遇到被车撞对方全责却得不到赔偿的情况,法行宝能立即给出四个步骤的指导:先是保留相关证据,请求交管部门去调解,如果调解失败,可以再提起民事诉讼、申请法院的强制执行。但它的作用远不止停留在咨询这一层面,还包括但不限于计算交通事故赔偿、帮忙写起诉状、按照不同领域推荐知名律师解决更复杂的问题。因此,法行宝已经成为了许多人专属的AI免费律师。
可以肯定的是,人类对智能体的开发将远不止这些。目前,百度新搜索已经成为了智能体分发最大入口,日均分发已超1000万。截至2024年11月,百度文心智能体平台已经吸引了15万家企业、80万名开发者入驻。
“我是软件工程师出身,国外有个说法,软件吞噬世界,世界不应该被吞噬,而应该被创造。AI时代,应用创造世界。”熬得过万丈孤独,挺得过烈火烹油,现在这个心怀信仰的人,有耐心也有决心,面朝星辰大海,和AI以及背后的人们,一起创造全新的世界。
来源:石头城平凡的鱼仔