摘要:当AI巨头试图从软件生态向硬件终端跨越时,算力这座“冰山”浮出水面。10月6日,《金融时报》披露,OpenAI与苹果前设计总监乔纳森·伊夫(Jony Ive)合作的首款神秘AI硬件,因遭遇严重算力瓶颈可能推迟发布。
当AI巨头试图从软件生态向硬件终端跨越时,算力这座“冰山”浮出水面。10月6日,《金融时报》披露,OpenAI与苹果前设计总监乔纳森·伊夫(Jony Ive)合作的首款神秘AI硬件,因遭遇严重算力瓶颈可能推迟发布。
这款原本计划2026年亮相的手掌大小无屏设备,承载着OpenAI“从模型到终端”的战略野心,但其“始终在线”的交互构想与设备端算力的矛盾,正成为横亘在梦想与现实间的核心障碍。这场推迟背后,是AI硬件时代算力、功耗与体验的复杂博弈。
算力瓶颈:“始终在线”构想遭遇硬件极限
这款备受瞩目的AI硬件,其核心设计理念是“无屏交互+持续感知”——手掌大小的机身集成摄像头、麦克风与扬声器,通过音频和视觉提示感知物理环境,实时响应用户请求,并通过持续数据收集构建虚拟助手的“记忆”。但这一构想对算力提出了苛刻要求。
“设备需要同时处理视觉识别、语音理解、实时推理三大任务,且要在低功耗场景下运行,这超出了当前移动芯片的能力边界。”麻省理工学院计算机科学与人工智能实验室(CSAIL)研究员马克·汉森解释道。据行业测算,要实现流畅的实时视觉场景分析与GPT-4级别的语音交互,设备端AI芯片需具备至少10TOPS的算力,同时功耗需控制在5W以内。但目前主流移动AI芯片中,即便是高通骁龙8 Gen4的NPU算力也仅为6TOPS,且满负载功耗达8W,难以满足“始终在线”的需求。
更棘手的是“边缘计算与云端协同”的平衡难题。若将部分运算交由云端,会面临网络延迟与隐私争议;若全靠设备端,又受限于芯片算力与续航。据知情人士透露,OpenAI曾测试“轻量化模型+云端增强”方案,但在弱网环境下,语音响应延迟达2.3秒,远超用户可接受的0.5秒标准,这成为项目推迟的直接导火索。
赛道竞速:AI硬件进入“终端定义体验”时代
OpenAI的硬件探索并非孤例。当大模型竞争进入白热化,科技巨头纷纷将目光投向硬件终端,试图通过“模型+设备”的闭环抢占下一代入口。目前AI硬件赛道已呈现“三派竞逐”格局:
手机厂商派以苹果、谷歌为代表,依托现有移动终端升级AI功能。苹果计划在iPhone 16系列中集成“端侧GPT-4精简版”,支持离线语音助手;谷歌则为Pixel 9系列搭载Tensor G4芯片,强化实时翻译与图像生成能力。这类方案的优势是依托成熟供应链,但受限于手机形态,难以实现“无感交互”。
互联网巨头派如Meta、亚马逊,聚焦专用智能设备。Meta的Quest 4 AR眼镜已实现基础AI交互,亚马逊则升级Echo Show系列,加入视觉感知功能。它们的核心策略是“场景绑定”,但普遍存在模型能力薄弱的问题。
AI原生派即OpenAI这类企业,试图以大模型优势定义全新硬件形态。“OpenAI的独特之处在于,它希望硬件成为大模型的‘物理延伸’,而非简单的‘功能载体’。”行业分析师萨拉·刘易斯指出,“但这也意味着它需要解决软件公司跨界硬件的所有痛点——供应链管理、硬件成本控制、功耗平衡。”
市场研究机构Gartner预测,2027年全球AI专用硬件市场规模将达1180亿美元,年复合增长率超45%。但前提是,行业需在2026年前突破设备端算力瓶颈,否则将面临“需求旺盛但产品缺位”的尴尬局面。
破局难点:不止算力,还有生态与隐私的双重拷问
算力之外,OpenAI还需跨越生态与隐私的双重门槛。在生态层面,这款无屏设备需要构建全新的交互范式——既非手机的触控,也非智能音箱的纯语音。据爆料,Jony Ive团队曾设计“手势+语音+视觉”的融合交互方案,但缺乏对应的应用生态支撑。“目前没有开发者为这种无屏设备开发专属应用,用户买回去可能只是个‘高级语音助手’,这难以支撑其预计的300-500美元定价。”萨拉·刘易斯补充道。
隐私问题则更为敏感。设备“持续收集视觉与音频数据”的特性,已引发监管机构关注。欧盟《人工智能法案》明确要求,实时数据收集需获得用户“明确且持续的同意”,而美国加州的《消费者隐私法》也对生物数据处理提出严格限制。“OpenAI需要证明,它能在‘记忆构建’与‘隐私保护’间找到平衡,这可能比算力问题更难。”斯坦福互联网观察站研究员艾米丽·吴表示。
供应链挑战同样不容忽视。由于采用独特的无屏设计,设备需要定制化的摄像头模组与音频芯片,而当前全球芯片代工产能紧张,尤其是低功耗AI芯片的代工周期已长达12个月。有消息称,OpenAI曾与台积电洽谈专属产能,但因订单规模不足被排在优先级队列之后。
来源:咫尺观察