摘要:在AI时代,如果你还认为AI只是可以写封邮件、生成图片,或更甚者,只能进行信息检索,那你其实只看到了这场变革的冰山一角。我最近一直强调,我们正站在服务规模化时代的起点。最近英伟达又让世界朝着这个时代推进了一大步,今天的文章就来好好聊聊。
本期要点:AI浪潮中的真机会,究竟是什么?
你好,我是王煜全,这里是王煜全要闻评论。
在AI时代,如果你还认为AI只是可以写封邮件、生成图片,或更甚者,只能进行信息检索,那你其实只看到了这场变革的冰山一角。我最近一直强调,我们正站在服务规模化时代的起点。最近英伟达又让世界朝着这个时代推进了一大步,今天的文章就来好好聊聊。
上周,英伟达发布了专为长上下文推理与视频生成设计的革命性GPU——NVIDIA Rubin CPX。
而且,英伟达还基于Rubin CPX和GPU以及Vera CPU,设计了专门用于长文推理的性能怪兽“Vera Rubin NVL144 CPX”(名字可不读),性能达到每秒800亿亿次计算,拥有100TB高速内存,能同时塞下大量资料以备随时调用,和1.7PB/s的传输带宽,一秒钟就能传输整个国家图书馆所有藏书的数据量。
对于大部分人而言,英伟达芯片性能的暴增已经见怪不怪了。不过,这次的关键突破在于,这个新的芯片能够处理超过一百万个Token的上下文长度,约相当于一部《红楼梦》所包含的内容。
这究竟意味着什么?
在我看来,要看懂英伟达的战略布局,就要明白Rubin CPX实现长上下文的意义。Rubin CPX的发布,有三大重要意义:
第一,这标志着英伟达不仅没有被追赶,反而通过定义下一代技术范式,进一步拉大了与追随者的身位。这次推出的Rubin CPX被称为英伟达的首颗专用推理芯片,也呼应了黄仁勋近期反复强调的,推理也符合Scaling Law。也就是说,英伟达通过提升推理的门槛,成功破灭了“当推理需求爆发式增长后,其他竞争企业可以通过低价优势来争夺推理用GPU市场”的希望。其他企业的业务虽然也会保持比较高的增速,但那纯粹是因为市场暴涨的结果,却无法追近和英伟达的距离,更不用说撼动英伟达的地位了。
第二,英伟达通过赋予AI长期记忆,很有可能引爆一场由AI驱动的服务革命。
百万级Token所带来的直接应用,不就是处理更长的文档、编写更复杂的代码、生成更长的视频,难道还有什么其他的方面吗?
现在,智能服务已经进入爆发期,AI的专家能力越来越强,但大多数仍然是只能提供单次互动的简单服务,就像看病,只能门诊,却不能提供长期治疗。
在我们以往的文章中,就曾提到,连续服务需要记忆力,百万级Token所带来的,将是AI记忆能力的大提升。而这才是引爆AI服务革命的关键。
过去的AI模型,受限于上下文窗口的长度,就像记忆只有7秒的鱼,输入的内容一多,AI就会傻了,前言不搭后语。
AI的这种失忆症源自背后硬件的限制。比如过大的输入量,就会超过硬件的吞吐量,并且造成严重的延迟,可能需要几分钟甚至几十分钟才能完成运算,严重影响使用体验。
英伟达则通过分解式推理的架构,把原本由单块GPU完成的推理任务,分解为由Rubin CPX负责并行处理长上下文的预填充,和Rubin GPU进行的解码和内容生成。
这种分工就让需要长期记忆的复杂服务成为可能。
用户可以把海量的数据直接发给AI大模型进行处理。未来基于Rubin平台的AI,甚至能记住用户每一次交互记录、上传过的所有文件和讨论过的细节。这才是我们所谓专家级复杂服务的绝对先决条件。
就像AI金融顾问,能通过长期互动记住用户所有的财务状况、投资偏好,以及以往所有的操作记录,还能在每次提供建议时调取资产价格的历史数据并快速分析,甚至基于这些数据和互动反馈情况对自己的算法进行迭代。
这种AI金融顾问,比AI大模型的简单问答所给出的资产配置建议,一定会更加精准,也更具个性化,更适合你的风险承受能力和长期目标。
第三,复杂服务将大量出现,我们以前想都不敢想的专家服务,现在可以以极低的价格为我们长期提供,像孩子的家教,成人的职场教练,像健康顾问,像投资理财专家……这将带来经济的极大繁荣,也会带来一大波创富机会。抓住这波机会的人,将成为驾驭未来的弄潮儿。
我想强调的是,这无疑是AI革命的关键转折点。
回顾历史,每次重大的技术革命都遵循一个“三段论”的规律:基础硬件就绪,杀手级应用出现,最后经济发展模式发生变革并爆发性增长。
如工业革命的基础设施就是蒸汽机,杀手级应用是大规模生产布料和衣物的工厂,英国经济因此实现快速增长,成为全球霸主。
如果说GPT-4的出现相当于工业革命的瓦特蒸汽机替代纽科门蒸汽机——瓦特蒸汽机让煤矿抽水更加高效且便宜,GPT-4让我们能更快的写文章、搜集资料,那么由Rubin CPX所支撑的、基于长期记忆的专家级复杂服务,就相当于划时代的工厂,满足每个人独特而又普遍存在的服务需求。
这种专家级复杂服务才是真正改变经济发展方式的杀手级应用。
就像之前所提到的金融顾问,是以往大部分普通人必然难以接触和承担的昂贵服务,服务质量也参差不齐,严重依赖于顾问的分析能力。
但未来,随着AI推理成本的下降,每个人都很有可能可以通过AI获得类似的金融顾问服务,价格也会非常普惠。
而这将创造一个庞大的全新市场。
一个中产家庭,未来可能每月仅需支付几百块钱,就能拥有一个随时待命的AI金融顾问。过去被高昂价格排除在外的数亿用户将被激活,从而创造出一个价值数万亿的全新经济领域。
也就是说,AI不只是节能增效了,而是真正满足以往技术难以支撑的专家级服务,并实现服务的民主化。这才是真正的AI原生。
特别是,金融只是服务规模化时代的一个领域。随着AI向各行各业的渗透,未来在财务、健康管理、日常管理、娱乐、旅游等各方面,我们都会拥有特定的AI工具,提供个性化、持续且普惠的专家级复杂服务。
当然,这类服务的普及必将带来巨大的经济增长。
方舟投资(ARK Invest)的木头姐Cathy Wood就曾预测,AI可能可以让美国GDP增速超过7%,但她认为需要AI、机器人、能源存储、区块链和多组学测序等多个领域的融合发展。
但我觉得,回顾工业革命的规模化生产方式给经济带来的增长,就能推断出,实现专家级复杂服务的规模化提供,就足以推动社会和经济进入新的繁荣。
当然,话说回来,在这个过程中,推理将占有非常重要的位置,对复杂推理的需求也必然会爆发。很明显,Rubin CPX的出现表明英伟达仍然是未来芯片领域的霸主,博通、AMD等希望在推理端对英伟达弯道超车的企业,估计仍然只能跟着喝喝汤了。
王煜全要闻评论,我们明天见。
来源:王煜全