摘要:今年 Google I/O 之后,Android XR 作为 Google 下场 AI 眼镜领域战略中的关键一步,被再次详细介绍——不仅有 Google 自家搭载 Android XR 的 AI 眼镜作为压轴戏,在主题演讲中登场。
今年 Google I/O 之后,Android XR 作为 Google 下场 AI 眼镜领域战略中的关键一步,被再次详细介绍——不仅有 Google 自家搭载 Android XR 的 AI 眼镜作为压轴戏,在主题演讲中登场。
如此高规格,很难不让人想起 2012 年、同样是在 Google I/O 上发布的「上古级 AI 眼镜」Google Glass、彼时谢尔盖-布林佩戴着它,从飞机机舱内跳出同时全程直播,至今仍然是科技史上让人津津乐道的名场面。
但 Google Glass 并不是一款在商业上取得成功的产品。十三年后,谢尔盖-布林再次来到 I/O 现场,为 Google 在 AR 眼镜领域的下一步背书,甚至不惜在接受媒体采访时,承认自己在 Google Glass 项目上「犯了不少错误」。
「我当时根本就不了解消费电子供应链,真的,也不清楚打造这么一款眼镜,然后以合理的价格销售以及管理所有制造流程等等究竟有多难。」谢尔盖 - 布林在接受媒体采访中如此「忏悔」道。
布林还提到十几年前 Google Glass 诞生时还存在「技术差距」,但这在今时今日已不存在。「如今在 AI 领域,这些眼镜能够帮助你,同时又不会一直分散你的注意力,这就比以前有用多了。」
近两年随着 Google 凭借 Gemini 以及一系列 AI 能力落地的产品,在市场上逐渐占据一席之地,谢尔盖-布林这位当年的传奇创业者,再次回到 Google 活跃并参与到 Gemini 的研发工作中,他的发言,很大程度上代表了 Google 当下对于 Android XR 乃至 AI 眼镜的态度:硬件载体甚至包括 Android XR,都不是当前的最重点,以 Gemini 为代表的一整套 AI 能力才是。
Google 现场演示的 AI 眼镜 Demo | 图片来源:极客公园
在 Gemini AI 能力展区中,Google AI 眼镜 Demo 的演示也是排队最多的展区;不少开发者在现场顶着太阳,排超过一个小时的队伍,只是为了能在高度保密的展示区,体验不到五分钟的 Google AI 眼镜能力。
不只是谢尔盖布林,Google 甚至直接在主题演讲中,直接宣称眼镜将会是「Gemini 的最佳载体」,将其地位置于智能手机以及其他所有 AI 硬件形态之上。
作为在 Meta 与 Apple 之后,踏进同一条河流的硅谷巨头,Google 这次真的能依靠着 Gemini,重新在 XR 领域复刻 Android 的成功吗?
01
时隔十三年的梦
或许对谢尔盖布林来讲,Google Glass 的失败是他至今难以接受的一件事——尤其是当你先别人一步看到未来,但因为现实的技术条件限制不得不放弃、如今却被 Meta 抢先在商业上取得成功的情况下。
在采访中,谢尔盖布林还特别指出,现在的谷歌不用再孤军作战,他们已经有了三星(Project Moohan)、Xreal(Project Aura)这样的「优秀合作伙伴」一同发展 Android XR。
据笔者了解,Android XR 项目立项于这一波 AI 硬件浪潮尚未正式爆发的 2022 年。最初的核心指标,是打造一款「尽可能独立运行、不依赖智能手机或者其他外部计算设备」的 AI 眼镜——这意味着眼镜需要同时内置处理器、电池以及各种传感器,因此最初的 Demo 更像是滑雪护目镜那样笨重的外观。
但这样打造出来的产品,显然与 Google 高层希望打造的「全天候佩戴的 AI 助理」概念相去甚远,因此 Project Iris 项目在 2023 年年初被爆出遭遇「重大挫折」,并伴随着一系列人事变动,同时产品方向进行了重大调整。
方向调整过后的 Project Iris,不再追求眼镜端独立计算,而是追求通过与 Android 系统智能手机(特别是 Google 自家的 Pixel 系列手机)的计算联动,由手机承担主要的计算需求,眼镜本身作为一个「终端传感器」,仅需要完成必要的传感器信息处理与收集。
随着之后 2023-2024 年 Google 内部又进行了多轮裁员,负责 AI 眼镜团队也遭到了波及,自研 AI 眼镜的计划也在之中被彻底取消,取而代之的是与三星、XREAL 这样的公司合作,负责产品主要的硬件开发与最终上市/销售——这也是今年内 Android XR 会上市的两款硬件的硬件合作方。
在今年 Google I/O 现场开放体验,完成度明显更高的三星 Project Moohan,笔者体验过后觉得其已经在重量上相比 Apple Vision Pro 有着巨大优势,目前其中 Gemini 也能依靠更加强大的算力,完成包括屏幕内容识别、自动推荐内容等场景。
据 Google 员工介绍,虽然名称上 Android XR 仍然隶属于 Android,但实际上 Google 已经将其作为「面向原生 AI 需求的操作系统」来构建基础架构,在原生 Android 的基础上进行大幅调整,让 Gemini 能低功耗运行在系统底层,从而尽可能在系统层面上满足「低功耗全时运行」这一指标。
在现场体验中,笔者不仅体验到了在虚拟显示操作系统中,直接与 Gemini 进行语音交互,Gemini 还能无需额外权限,直接读取当前屏幕内显示的所有内容,例如当你在搜索中输入某个餐馆的点评信息,然后询问 Gemini「如何前往这家餐厅」,Gemini 就能立即创建一个新增的导航界面。
但在 Google 内部多轮裁员的影响下,最终 Android XR 将硬件产品发展方向,确定为了「与 OEM 厂商合作打造 Android XR 硬件」,也就是如今我们看到的三星、XREAL 首发硬件阵容。
这种模式非常类似早期 Android 系统上 Google 与智能手机厂商的合作模式,Google 将重心放在 Android 系统本身的开发,市场份额的攻城略地依靠智能手机品牌来完成——只是这次 Gemini 成为了新的主角,Android XR 只是一个供 Gemini 大展身手的原生新平台。
对 Gemini 来讲,XR 类设备的最大潜力在于它相比手机、电脑等单一场景下的智能硬件,能在系统级的基础上,兼顾虚拟世界与现实世界的信息感知,从而大幅提高 Gemini 接管用户日常使用的场景的比例,而 AI 眼镜更是能获得几乎「无限」的现实世界信息,进而大幅提高 Gemini 在用户日常生活中的存在感。
围绕着这样的场景,Google 其实已经蛰伏已久:2024 年,Google DeepMind 公布 Project Astra :一个前沿的 AI 助手项目。旨在打造一个能够理解和响应我们周围世界的通用人工智能助手。基于 Gemini 实现不仅仅是被动回答问题,而是主动去尝试理解用户的意图,通过关键信息记忆 + 多模态能力识别,实现类似「用户把某样东西放哪里了」这种上下文信息的回溯。同时进行实时语言翻译以及协助处理信息等任务。
Google 在多模态模型领域的长期投入,让 Gemini 成功成为了 Android XR 整个概念中的「明星」,引爆了外界对 AI 眼镜这一品类的期待,尤其是 Google 宣传的「全天候感知周边环境」、「主动预测用户需求」等场景,似乎真正的足够智能的多模态 AI 眼镜已经出现。
在 Google 在 I/O 现场演示的 AI 眼镜 Demo,其产品整体形态类似 Rokid、雷鸟此前已经发布过的产品,最主要的区别在于这款 AI 眼镜 Demo 运行 Android XR 系统,能在一定程度上支持由现有 Android 应用转制开发而来的 Android XR 应用。
在 Google 的设想中,Android XR 应该是覆盖了现有全部 XR 设备——从体积最大、直接对标 Apple Vision Pro 的三星 Project Moohan,到由 XREAL 打造、搭载 Android XR 操作系统的 AR 眼镜 Project Aura,再到 Google 自家现场可供体验的 AI 眼镜原型。
据接受《极客公园》采访的 Android 团队工程师介绍,三星 Project Moohan 项目立项于 Apple Vision Pro 正式发布之后,定位狙击苹果 XR 战略,三星也在期待着苹果能用其自身举足轻重的市场影响力,将 XR 领域的最难的部分:无论是供应链还是用户对 XR 头显的市场认知教育问题解决。
但 Apple Vision Pro 的销量与市场反响均不及预期,这在很大程度上也影响了 Google 与三星对这一项目的信心,因此 Google 随即大幅下调了 Project Moohan 的出货预期,同时售价更低、且整体重量更加轻便的 XREAL Project Aura 被进一步寄予厚望,作为首批上市 Android XR 硬件中承担出货量预期的主要产品——按照 XREAL 预计,搭载 Android XR 的首款 AR 眼镜销量将超过三十万台。
至于在今年 Google I/O 期间展出并小规模体验的、实际上是 Project Iris 项目的存货,最终并不会实际上市。
据 XREAL 创始人徐驰介绍,在目前的预计中,Android XR 首批上市设备中出货量最大的设备会是 AR 眼镜,这一点也是决定 Android XR 在今年内能否快速推广、得到用户认可的关键一步,因此硬件上 Project Aura 这款产品几乎完全由 XREAL 主导,借助相对已经成熟的硬件体验,辅以 Android XR 操作系统,实现 Android XR 生态的快速构建。
XREAL Project Aura 将 AI 作为新品的主要卖点 | 图片来源:XREAL 官网
XREAL、三星均计划在正式的产品最终开售之前,通过开发者套件的形式提前发布,让开发者有机会提前上手全新的操作系统,以及 Gemini 在这个全新的空间操作系统中,能在给第三方 App 提供哪些全新的接口,提供端侧 AI 能力的支持。
02
「烫手山芋」
诚然十三年后的智能眼镜供应链,已经足以打造出远超 Google Glass 的成熟硬件,但当前的硬件水平,实际上能否打造出一款如同 Google 宣传的那样、「始终在线的 AI 助手」,对 Google 而言仍然充满挑战。
比起谢尔盖布林「硬件已经不存在差距」的自信,实际上 Google 最终放弃打造第一方 AI 眼镜,很大程度上也确实是受限于当前硬件技术,仍然无法在 AI 眼镜这个载体上,完全实现 Google 为 Gemini 构想的一系列使用场景。
据参与到 Android XR 项目的相关项目成员介绍,目前 Google 在 Android XR 硬件中,类似 Project Astra 那样、几乎是全时感知处理用户周边环境中各种信息的使用场景,是如今智能眼镜这一载体难以承载的功耗。因此如何支撑眼镜拥有一个用户可以接受的日常使用电池续航,以及如何处理眼镜传感器在端侧接收到的用户/环境数据,是主要难点。
不同于 Meta Ray-Ban 依赖蓝牙协议,将所有眼镜端接收到的用户数据传输至用户手机,交由手机处理再将结果发送回眼镜端的解决方案,Google 在搭载 Android XR 的 AI 眼镜原型早期方案中,尝试让眼镜端完成主要的数据处理,仅将大模型交互、即时信息查询等请求转发给手机处理。
在架构上 Android XR 能够满足这样的要求,但硬件上,即使 Google 相比 Meta 有 Android 系统作为优势,但在「全天候佩戴的 AI 助理」这个目标上,硬件的限制仍然非常明显。
「硬件中无论功耗、续航都不是简单的问题,全部都是坑。」Android XR 工程师这样介绍 Google 在 AI 眼镜项目中遇到的难题,
据介绍,一款 AI 眼镜量产,首先要做 DFM(可制造化设计),同时做出来的 Demo 要能高效生产。但目前 Google 内部演示的 Demo 完全没有考虑到续航这一问题,换言之这款产品更多是为了向外界公开演示 Gemini 能在 AI 眼镜这个形态上做到的最大可能性,而非一款目标最终大规模量产的产品;仅仅是使用 Gemini 识别眼前内容并交互,这款 Demo 的实际续航也无法超过两个小时。
同时,如何在算力极为有限的智能眼镜端侧,运行各种基于实时感知的显示内容,至今仍然是难以解决的问题;包括 Google 曾在去年年底展示过、使用 Google Maps 实现实时导航的功能,如今都暂时无法实现。
即使这些瓶颈现实存在,但 Google 的工程师依然希望将 Gemini 作为未来 AI 眼镜交互的重点,因此 Google 走上了与 Meta 相同的技术路线——首选无显示功能的眼镜形态。
值得一提的是,虽然 Google 本身算是可穿戴领域的老兵,但对于如何造好 AI 眼镜,借此与苹果与 Meta 竞争这件事并没有充分的经验,但同时也在裁员的同时,从外界招募了众多行业一线研发人员来充实队伍,其中不乏前 Meta 甚至是前 AVG(Apple 内部负责 Vision Pro 业务的事业群)的大牛加入。
目前,Google 内部目前有数千人的开发团队负责完善 Android XR 在这些硬件上的开发完善、乃至后续的支持。
虽然今年 Google 公开展示的 AI 眼镜 Demo,实际上并不会最终上市。但凭借着 Gemini 在 Android XR 中统治级的地位,Google 仍然在竭力拓展 Android XR 的生态圈。
2024 年,Meta 与依视路(雷朋 Ray-Ban 母公司)在 Meta Ray-Ban 系列上的合作大获成功,Google 也在 2024 年开始,尝试在时尚领域寻找有「强烈合作意愿」的合作伙伴。
最终,曾经有与华为联手打造智能眼镜合作经验、但因为双方理念不合分手的 Gentle Monster,以及美国本土主打时尚感的新兴眼镜品牌 Warby Parker,成为了 Google 打造 AI 眼镜时的时尚品牌合作伙伴。
但这些时尚品牌并不具备足够的硬件开发能力,最终它们的 AI 眼镜项目仍需要有足够经验的硬件合作方来代工完成,因此这些产品的最终量产与迭代,仍然会选择对应的中国 AI 眼镜代工厂来完成。
与目前 Google 展示出来、带有基础显示能力的 Demo 不同,这两家时尚品牌与 Google 合作打造的 AI 眼镜,都将会是与 Meta Ray-Ban 类似、没有内容显示能力,完全依靠语音与 Gemini 实现复杂交互。
即使 Google 未来仍然有打造 AI 眼镜的计划,也会将重心放在「与硬件厂商合作」这一方向上,减少谷歌在 AI 眼镜上硬件投入的比例,专注于完善 Android XR ——尤其是 Google 最看重的 Gemini 体验。
除了现在已经广为外界熟悉、直接对标 Apple Vision Pro 形态的产品 Project Moohan,三星还在筹划另外两款在 Android XR 操作系统的设备,Project Haean 与 Project Jinju;与 Moohan 对应的韩语单词「无限」相同,这两款设备的代号同样来自韩语音译,对应的意思分别为「海滨」与「珍珠」。
前者是一款由三星打造、搭载 Android XR 操作系统 AI 眼镜,在外形轻薄的同时支持与 Gemini 实现语音交互,同时有着比 Meta Ray-Ban 更长的续航时长的 AI 眼镜产品,后者目前即使是 Google 内部,也鲜有人知准确的产品形态,但根据目前信息综合判断,Project Jinju 将会是一款带有实验性质、同时带有更加复杂的内容显示能力的 AI 眼镜形态产品。
即使 AI 眼镜最终仍然要经历 2-3 年的市场成熟期,谷歌仍然能够凭借 Android XR 为生态布局,加上与三星这样的后发行业巨头、XREAL 这样新兴但已经占有一定市场份额的 AR 眼镜厂商。尝试复刻 Android 的成功,而不是 Google Glass 的失败。
来源:金融界