摘要:在 OpenAI 的 Sora 掀起全球视频生成狂潮之际,百度却选择了一条截然不同的道路。上周的百度世界大会上,李彦宏进一步强调「无论 Sora 多火,百度都不去做」,转而将资源投向解决 AI 幻觉问题。这个决定背后,既有技术路线的深思熟虑,也暗含着商业层面的
在 OpenAI 的 Sora 掀起全球视频生成狂潮之际,百度却选择了一条截然不同的道路。上周的百度世界大会上,李彦宏进一步强调「无论 Sora 多火,百度都不去做」,转而将资源投向解决 AI 幻觉问题。这个决定背后,既有技术路线的深思熟虑,也暗含着商业层面的精准算计。
表面上看,这似乎是在 AI 多模态竞赛中甘愿落后。但仔细推敲,百度的选择更像是一种「明哲保身」。通用视频生成模型需要天文数字般的投入——据估算,仅训练成本就需要 4200~10500 块 H100 GPU,而大规模部署更需要约 72 万块,总投入可达 216 亿美元。即便投入如此巨资,技术成熟度依然存疑。此前备受关注的艺术短片《Air Head》被指实际仅有约 1/300 的素材来自 AI。
百度转而推出的 iRAG 技术,瞄准的是制约 AI 大规模落地的关键痛点 —— 幻觉问题。在当前阶段,这个选择可能比追逐尚不成熟的视频生成更具商业价值。没有哪家企业会将关键业务托付给一个「说谎成性」的 AI 系统。解决幻觉问题,是打开 AI 商业化大门的钥匙。
多模态并非只有视频生成一条路。Meta 的 Yann LeCun 坚持「世界模型」路线,斯坦福的李飞飞则着眼具身智能。百度选择从数字人切入,已在新闻播报、直播电商等场景取得实质进展。这种「小步快跑」的策略,或许比追求大而全的通用方案更契合当前市场需求。
关键在于商业逻辑。Sora 式的通用视频生成尚未找到清晰的变现路径,而针对具体场景优化的解决方案却已开始创造实际价值。在 AI 领域,技术领先不等于商业成功。正如李彦宏所言,「模型本身不产生直接价值」。
百度的算盘打得很明白:先在确定性强的领域构建护城河,积累真实场景的数据和经验,再谋求更宏大的技术突破。这种循序渐进的策略,或许也是 AI 商业化的正确打开方式之一。
但挑战依然存在。当 OpenAI、Google 等公司在突破 AI 能力边界时,中国最具实力的 AI 公司却选择了一条相对保守的道路。这种「求稳」思维,与李彦宏此前塑造的创新者形象形成鲜明反差。
百度的选择也折射出中国 AI 产业的结构性问题。在缺乏足够的基础研究投入和长期技术积累的情况下,即便是行业龙头也难以在真正具有颠覆性的技术方向上与全球科技巨头展开竞争。这种「重应用轻研发」的倾向,可能导致中国 AI 产业在下一轮技术革命中继续处于追赶地位。
对于李彦宏和百度而言,「不做」背后的算盘打得很精,但这笔账是否经得起时间的检验,恐怕还需要市场给出最后的答案。
来源:互联科技焦点