摘要:直到这两年,随着光学显示、传感器和处理器等核心部件的优化,AR眼镜的重量和尺寸大大减轻,续航时间延长,用户体验得到提升;此外,SoC、光波导、Micro-LED显示等技术的突破也使得AR眼镜成本进一步降低;今年随着以大模型为代表的AI技术涌入AR领域,AR+
长期以来,AR眼镜都被认为会替代手机,成为下一代平台计算终端。
但多年来,行业的前行进展并不及预期,产业链各环节攻坚进程缓慢,产品体验、价格、场景拓展等问题迟迟未得到解决。
直到这两年,随着光学显示、传感器和处理器等核心部件的优化,AR眼镜的重量和尺寸大大减轻,续航时间延长,用户体验得到提升;此外,SoC、光波导、Micro-LED显示等技术的突破也使得AR眼镜成本进一步降低;今年随着以大模型为代表的AI技术涌入AR领域,AR+AI 也为AR眼镜带来了更多场景的想象空间,魅族科技前副总裁的李楠更是在近期预言“AI 眼镜市场在 12 个月之内会增长10倍。”
但当前的AR眼镜尚未成熟到成为主流智能终端,如何找到AR终端的“杀手级应用”,让市场为之买单,并持续优化产品体验,是未来AR产业下一个高点到来的关键。
何时AR眼镜才会迎来产业化“奇点”?从光机层面来说,“完美显示”需具备哪些特点?SoC层面是行业最大掣肘?AR产业链当前还有哪些投资机会?《华映对谈》近期邀请到小饭桌创投投资经理黄子洋担任主持人,与华映资本董事刘天杰、镭昱光电创始人兼CEO庄永漳以及Rokid全球开发者生态负责人赵维奇围绕以上问题进行探讨交流。
痛点与挑战:
价格、质量、重量、佩戴的平衡
黄子洋(主持人):请各位介绍一下自己所在的公司情况,以及谈一谈对AR行业当前发展的见解。
庄永漳:当前市面上广义的AR眼镜有很多类型(AR/VR),大多采用Micro-OLED+ BB(BirdBath)的方案,但这更偏向是一个VR的分支,它更多关注虚拟的内容,所以这并不是我们目标的AR眼镜。
关于AR眼镜的形态,当前业界已经达成一定共识——未来的AR眼镜将与普通眼镜相似。要推动AR眼镜的普及,关键在于实现“轻便型眼镜”这一形态。然而,基于这一外观设计的要求,各方面都面临较高挑战。减轻重量意味着电池体积需要相应缩小,这直接影响到续航能力。此外,显示效果、功能性、视力调整等方面的要求也都需要兼顾。所以要将所有核心点集成到眼镜中非常困难,只有各项硬件的成熟才能最终形成一个比较适合消费电子的产品规格。
在这一过程中,对光学显示的要求也显得尤为严格。光波导技术作为光显示的核心模块,是实现镜片型光学模组的关键。通过光波导技术,可以将光源部分巧妙地集成在镜腿旁边,并通过耦合点将光源的光引入镜片,随后将光导入眼镜中央区域,从而让用户能够通过波导镜片的中心区观看虚拟内容。同时,光波导技术具有极高的透光率,使得用户不仅能够清晰地看到虚拟内容,还能透过波导镜片看到现实世界,这也是AR眼镜所必须具备的功能,因为虚拟内容主要起到辅助作用。
但目前的主要问题在于:光波导镜片的光效较低。传统的BB或其他曲面方案与Micro-OLED显示屏结合时,其亮度无法满足所需的光效要求。
当前也有一些脱离显示屏的案例。例如,Meta推出了一款不带显示功能的智能眼镜,通过集成AI技术,极大地拓展了其功能,整体局限性较小,并且已经实现了超过200万台的销售。人工智能大大推动了整个产业的发展,这也是一个现阶段能普及的方案,预计明年会有一大批初创公司或者巨头加大对AI智能眼镜的投入。
然而,AR眼镜最终仍需与眼球绑定,而实现这一点必然依赖于显示功能。未来,显示功能将成为智能硬件领域的核心竞争力,因为通过显示技术可以构建全新的生态平台。这也是众多大型公司积极参与该领域的主要原因。
Micro-LED微显示屏能够提供足够的亮度,以弥补光波导在光输出效率上的不足,因此,Micro-LED与光波导的结合是实现AR眼镜方案的关键。过去一两年,我们看到陆续有一些新的产品推出,大部分采用的还是单色Micro-LED ,到目前为止只有单色的Micro-LED 微显示屏有比较成熟的量产。但单色能显示的内容和信息维度非常有限,产业需要有一个全彩的方案来配合光波导,带来更好的视觉体验。
镭昱专注于高性能全彩Micro-LED微显示屏的研发和生产,在技术路线上,我们采用大尺寸晶圆级键合技术,配合光刻式量子点工艺(QDPR),于蓝光Micro-LED像素上定义红、绿光量子点图形,制备出单片全彩Micro-LED微显示芯片。整个技术路线全程采用标准半导体工艺,所有器件尺寸均由高精度步进式光刻机定义,在实现超高分辨率、超高密度的同时,保证了高量产性。
我们的核心工艺在于自主研发的量子点光刻胶配方。通过将量子点原材料混合到光刻胶中,我们能够实现量子点材料的均匀分布。通过悬浮光刻显影,可以直接在蓝光的Micro-LED表面形成一个量子点膜来进行光的转换。这一技术使得镭昱既能够提供全彩显示方案,同时也能将蓝光转化为红光,实现单色显示方案。通过色转换方案,可以有效避免原生红光的光效问题。
量子点的半波宽比较窄,光效高,纯度好,可以提供高亮度、广色域的显示效果,我们基于量子点光刻胶的方案可以达到超100%的色域表现。而且 Micro-LED 作为一种自发光的显示技术,具备出色的对比度,这是其他微显示技术无法比拟的优势。
今年我们有一个新产品——PowerMatch 1系列0.13英寸的微显示屏,能达到320×240的全彩分辨率,峰值全彩亮度达到了40万尼特。该产品能够与多种波导配合,呈现高亮度的显示,并与光机结合实现优异的投影效果。此外,它能匹配0.18C C光机,是目前市面上尺寸最小的微显示光机。
赵维奇:Rokid其实是一个成立十几年的公司了,主要专注在人机交互为核心的系统以及平台上,基于此,我们有支持系统软件和硬件的全方位产品。
过去AI主要停留在像音响或是手机平台上,但未来AR眼镜会是AI的最佳载体。对于一个AR产品来说,核心就是要解决四个问题——感知、理解、交互、展现。
· 感知:用传感器从外界吸收信息和数据。
· 理解:就是AI的部分,其实原来不管是端侧还是云端,核心就是算力和解决方案,通过这个方式分析和理解收集到的信息,知道用户在哪、要做什么、诉求是什么。
· 交互:Rokid偏向于更自然的交互,比如用语音、视觉、手势等通过人类本身能力的扩展来完成交互。
· 展现:呈现的质量以及各方面的要素是非常重要的,因为这是用户最能直接感受到的,所以展现也是数字内容在AR产业中非常重要的一环。
这四部分融合组成了AR的一个产品。
空间设备过去几年主要有两个方向的阵营——VST和AST阵营。VST就是摄像头抓取外面环境的影像,通过一块显示屏呈现在用户眼前,能达成用户和物理世界建立通道的方案;OST则是通过光学镜片直接观看物理环境,数字内容叠加在物理环境之上来完成虚实融合的交互。
VST部分,过去几年,有常规的VR一体机,比如Oculus Quest以及FTC的VR设备;之后又出现一些彩色透视VR一体机,包括Quest2、Quest3、vision pro;另外,还有VST AR分体机,形态更多是AR的形式,随着时间的变化,其实 VST 它会更偏向于分体,目的是为了让佩戴更轻便,这也是我们在做一个AR眼镜形态时始终会考量的——佩戴的舒适度、续航能力等,VST 的最终形态我相信还是轻量的 VST 一体机。
OST部分,早年间Rokid主要会做一些OST产品。之前市场上也有一些OST的产品出现,比如微软的 Hololens,细分来说Hololens属于OST MR一体机;另外,像庄博刚刚提到的影像通过其他终端投射到眼睛前面,虽然并没有空间计算的部分,但是有影像部分,这属于是OST投屏眼镜;过去几年还有OST AR有线分体机,我们之前做的都是有线的分体机,它是主机+眼镜的形式,让眼镜端更加轻便;还有一种当前行业内正在推进的光波导AR一体机,七八年前我们在做第一代产品的时候就推进了这件事,但因为技术、光学、物理层面的不成熟,整体生产链的成本较高,该类型的产品推进得较为缓慢,今年在AI爆发之后,大家发现除了传统的手表、音响之外,眼镜也是一个很好的承载方式,可以在上面添加很多元素,比如相机、麦克风、显示等,这推动了光波导带显示AR一体机的成长。
从趋势来说,去年大家发现可能会有一个OST AR无线分体机的方案,行业内高通以及一些其他厂商都在做;除此之外,前几年出过很多单色的光波导一体机,但是其续航、体验都一般,行业内都期望光学供应商落地全彩的光波导方案;最后,算力部分,当前端云一体的方式未来会被分离,有些部分置于端上,有些部分置于云上。
从场景来说,Rokid一直在深耕影音娱乐、效率办公、教育培训、数字文化、工业指导等场景,不同场景有不同的AR形态。
我们觉得一个好产品本身要做很多取舍:
· 均衡:作为一个新兴行业的创业者,我们需要在各个方面找平衡,价格、质量、重量、佩戴等。
· 性价比:对于一个to C产品来说,性价比至关重要。
· 产品体验:Rokid一直追求希望将体验做到极致。
· 空间计算:我们还是希望产品有很多感知、理解的部分以及更多可呈现的内容。
还有三个点是我们一直在考虑的,这也是Rokid最终想达成的目标:
· Always on:产品轻便,能让用户长时间佩戴得住,且外观可被接受。
· Rich-Content:眼镜上有非常多的内容呈现,并且可以支撑更多的场景化应用。
· Quick-in Quick-on:佩戴之后很快就能使用,学习曲线相对较弱。
十年来,从最原始的版本到眼镜的版本,我们一直秉持着这种基础的理念在做,且一直做的是眼镜的形态。
我们一个有代表性的产品叫AR Studio,大家去博物馆或者是去一些景区可以看到,甚至有一些教育行业或者是一些重交互的展厅(比如敦煌、三星堆)也可能会看到。它更多支持空间计算,某种程度上可以算是vision pro的平替,能让用户有六自由度的体验,同时将空间中的媒介都利用起来,我们可以在它上面覆盖任何数字化内容。我们比较注重自然交互,相对来说学习的时间会短一些;另外我们比较擅长的就是手势,这个产品可以完全将所有手指指节识别出来,并且做一些交互,这也是我们对AR Studio最引以为豪的地方。
我们也会对海外和国内的IP做一些线下的体验展,这是让AR眼镜走入生活的一种方式。
另一款比较轻量级的产品是AR Lite,这款产品上我们对屏幕多下了些功夫,有大屏、多屏、随身屏,大屏与随身屏很好理解,多屏是指用户可以同时打开多个屏幕进行操作。即使是 Lite这么一个轻量的产品我们也希望它能将三自由度发挥到极致。
另外我们还做了一个Station 2的产品,两颗摄像头可以录制空间视频,帮助用户更多地通过空间视频触达到普通大众,他们可以作为创作者加入AR的整个生态中。
最后说一下我们新出的Rokid Glasses,其实一些基础的功能大家也有听说过,但是在此之上,它还非常轻便、有比较不错的外形、再叠加上显示,其实是很不容易的。Rokid在做眼镜之前做了很久的语音音响,在语音语义、语音的部分优化上有一定的积累。目前这些经验都用在了眼镜上,所以Rokid Glasses上有多项麦克风,能保证对话双方的声音准确性互不受干扰。另外这款眼镜还有闪记、健康检测以及一些快速回复的功能。我们希望它是好眼镜、好耳机、好相机、好助手。
除了产品外,我们还做了很多产业化的应用。我们也是全球唯一一个被空间站使用AR设备的公司,包括工业、文旅、教育、医疗、线下乐园等领域都是我们在做的。
我们认为AI+AR一定是下一代的人机交互形式。AR本身是长在自然交互之上的,看到的东西与物理强相关,虚实融合是非常重要的一部分。AI不管是大模型还是端云一体,随着其能力越来越强,会成为人类感官的一个延展。
当然,挑战还是存在的,我觉得未来可能会有以下三个层面的挑战:
第一是硬件。光学结构、佩戴舒适度,包括一个小小的鼻托头,可能都会影响最后用户对产品的体验。Rokid一直致力于对硬件做比较极限的优化,比如,我们六自由度的眼镜,其实只有一颗摄像头来做3D手势和六自由度。
第二是OS。OS大家提的很少,但如果有显示、有多模态交互的话,OS的底层架构就非常重要了,它涉及到低功耗、高性能、强通信力,这是我们一直比较专注的部分,Rokid一直在打造自己 OS。我们希望做一个轻便硬件下的空间计算操作系统,这个操作系统就像一个“大管家”,最后负责所有资源的调配以及应用场景的优化。
第三是生态。生态是怎么带大家一起玩,我们自己可能开发的只是一个大的框架、场景化的部分,更多是和其他众多的开发者、合作伙伴一起挖掘的。当前我们也有部分的研究路线在做开源,做硬件本身最后的依赖就是供应链与上下游,我们把做得好的OS 部分开源,可以帮助到整个产业更多形态、更多场景眼镜的探索。
刘天杰:华映在AR领域持续布局,如果简单将整个行业按上下游来分:下游是整机厂,上游是核心零部件与技术栈。
整机厂中我们投资了蜂巢科技与奇点临近,前者的创始人是小米手机部部门总经理,也是小米生态链创建者之一;后者的创始人则是华为P6手机的首席架构师。在整机厂的投资上,我们的思路还是很明确的——投有手机背景的创业者。有几点原因,第一,在我们看来这是一个巨量的市场,需要创业者有手机这种产业链级别的操刀能力;第二,AR设备是一个极其复杂的消费电子产品,从手机到AR产业其实是一个升维的过程,其各个层面的要求甚至比手机还要高,所以需要在手机时代有一些成功的创业经历。
上游技术栈涉及到几个核心的技术——Micro-LED 、光波导、协处理芯片、主计算单元等。镭昱是我们在上游的被投企业之一,庄博在Micro-LED 单片集成领域是世界级的学者,师从的刘纪美教授也在行业内具有极高的权威性。关于衍射光波导、全息光波导我们也持续在看,但还没有出手。
从产业整体来说,前两年、甚至是今年上半年,我觉得发展都是不符合预期的,这其中苹果、高通两个大厂的表现尤为让人失望。任何复杂的消费电子产品最终都是由算力所驱动的,但时至今日,高通的芯片即便做了很多优化,依旧很难被置于AR眼镜的镜腿中。所以像Rokid这样的优秀的企业,能在算力端还不成熟的情况下,做一些场景侧的探索去支撑出货,也就是“沿途下蛋”,我觉得是非常好的尝试。
最近“AI赋能各类消费电子产品,是否是一个大变革”被广泛讨论着,我认为大部分电子产品平等受益,受益点来自于可以将模型置于云端,继而从端侧去访问云端的模型,最终展现出智能的能力。而AI对AR产品的赋能会显著高于其他电子产品。
我们简单将一个电子产品分成输入侧、计算侧和输出侧。
当前我们看到,几乎所有试图用AI去改造输出端的项目都失败了,比如前段时间很火爆的AI pin、Rabbit R1,其输出侧都是对屏幕的降级,从现在大家日常所用的高分辨率、高色彩饱和度的大屏,换成了单彩的、投到手上或者直接语音播报的形式。
但用AI去改造输入侧的项目却都离成功更近一点,因为本身AR输出侧就属于屏幕的升级,而输入侧一直是AR硬件面临的核心问题之一,不管是手势、语音、眼动还是环境的语义,其实效率都不高,但AI发展起来后可以用自然语言的方式去做输入侧的改变,长远来看,这会促进AR眼镜大规模出货,而下游的出货也一定会促进像镭昱这种上游技术栈的出货。当然我觉得在今天“沿途下蛋”的这些场景中,眼镜多数都是信息提示或只是一个助手,全彩的Micro-LED并非必须,单色Micro-LED会率先起量。
消费级AR眼镜的终局:
Always on、Rich-Content、Quick-in Quick-on
黄子洋(主持人):消费级应用的起量是否会加速产业化“奇点”的到来?这个“奇点”大概会是在什么时间?
庄永漳:“奇点”是能看到一个比较明显的爆发,从出货量角度来看,现在还没有达到爆发阶段。
过去行业内都是采用Micro-OLED+BB方案来做AR眼镜,未来会慢慢过渡到用Micro-LED+光波导的方案,尤其是随着成本的下降,会有更多的公司来尝试。但单色Micro-LED的功能比较受限,难以用比较高的售价去推动消费。我觉得真正的爆发点还是受性价比影响,最终还是要靠全彩Micro-LED+光波导成本的下降,来推动AR眼镜的销售。
除此之外,平台的附加值也在影响着行业“奇点”的到来,平台内容必须满足消费者的日常需求。如果AR眼镜仅具备一些单一功能,想要实现消费级市场的大规模放量会比较困难。
因此,我觉得从一个大方向来讲,Micro-LED的全彩化是推动AR眼镜规模化的关键。只有全彩的显示屏才能带来更丰富的内容,结合AI呈现更多样的信息,为消费者创造更多价值。
我也认为AI肯定是AR非常核心的要素。短期内AR眼镜很难达到Meta所描绘的水平,因为这对硬件的要求极为苛刻,而AR结合AI,我觉得做到个人助理功能的一个眼镜就可以有非常好的卖点,这个助理并不是普通地将用户的个人信息记录下来,而是借助AI成为用户的日常陪伴者,这种概念可能能推动行业的爆发。
而要达成这个概念 ,需要加上全彩化的显示。所以AR的最终形态一定是AR眼镜,且要做到轻便、低成本,综合起来才能推动AR眼镜产业上规模。
赵维奇:消费级的AR眼镜当前还处在比较初级的阶段。从产品来说,它最终一定要满足需求,创造价值。
目前看来,相当长一段时间内行业还是会保持产品矩阵的形态。当前的AR眼镜用户,不管是先锋的体验者还是刚需的使用者,他们要么是垂直的用户群,要么是有垂直应用场景。
关于垂直场景,举个例子,像观影眼镜BB方案都是应用于观影、游戏这些大屏上,大屏的刚需使用人群是出差人群、程序员等,他希望随时拿出大屏办公。这与AR眼镜的最终状态一定有契合的地方,但是属于过渡产品,从消费级产业化角度来说,会有一定的出货量,但是是在垂直场景。
关于垂直用户,当前市面上,有一些偏向运动类的用户,比如骑车、游泳等,也有一些针对这些的AR眼镜,这也是消费级AR眼镜的一个形态。
随着AI的推进,相较于手表,眼镜的形态会更好,因为更轻便,且应用场景更加普适化,更容易与原有的生态相关联,比如手表生态、 IOT 生态等。
其实一个消费级AR眼镜的终局,还是我刚刚说的Always on、Rich-Content、Quick-in Quick-on。用户可以一直戴着这个设备、设备内容丰富,所以最后肯定需要一个全彩的光波导解决方案;设备要轻便、能够接驳各个场景下的三方生态,比如手机生态、家中的IOT 生态、车机生态,这些都打通后,AR眼镜才会迎来爆发点。过程中涉及到很多资源以及对其他产业有很强的依赖,包括光学显示、算力、软件生态等。不管是AR还是VR,其实都并不成熟,目前行业没有达到一个很成熟稳定的良品率,比如光波导工艺的良品率是非常大的挑战。除了这些层面,AR眼镜还要佩戴好看、体积大小适宜、有较高的舒适度。
所以并不是说有一个“奇点”,这些事情就能完成,它是持续推进的过程。我不近视,所以从做AR行业的第一天我就问自己,“我为什么要戴上这副眼镜?为什么要在脸上戴上一个有重量的东西?”消费者希望获得的回报比戴上眼镜的成本更高,这是产业化才能带来的结果。现在肯定是多样化的状态,大家并行前进,最终可能会有两三种固定的形态,像现在的手表有机械表和电子表,AR眼镜到最后也会有很多形态,比如to B场景下与to C场景下,都会有适合自己的眼镜形态。
过渡状态下,品牌商都是为消费者提供场景化的产品来进行体验。AI赋予了使用场景更多想象力,原来消费者只在特定场景或者特定时间段使用AR眼镜,但AI加持之下,AR眼镜的场景得到拓展,同时也能取代目前其他设备的部分功能,比如翻译机、部分的手机(不需要再取出)。一些需求的满足,会让消费者时不时戴着它,但是随着更多需求被满足,消费者就会一直戴着它。
使用场景和价格是当前最大的挑战,价格与整个产业上下游的发展强相关,这也是我觉得很重要的部分。
其实我们现在只是管中窥豹看到一点点,眼镜的形态和其他的AI载体是很不同的,因为其他AI设备都是固定场合、固定人群在使用,比如音响,不能随身携带,比如手机,不能每时每刻都与它主动沟通,大部分情况下都是被动的。但眼镜与手表一样,甚至比手表更好,它的位置天然就在人体感官集中的地方,而且戴上之后,眼睛会将其他的感官也放大,伴随着我们的移动化的生活越来越普及,眼镜会变成一个非常好的载体,成为用户所有场景与信息化的终端,帮助用户迅速完成车、家、办公室等各个场景的状态切换。
而这才是AR眼镜的真正终局,也就是用户只要佩戴一个设备就能解决大多数的问题。回到刚才那个问题,我觉得最终的奇点是靠一个个小的奇点砌成的,比如针对文旅、观影场景的AR眼镜,都为行业带来了小的奇点。但这些小的奇点什么时候才能促成行业最终的形态,我觉得还有很长的路要走。
刘天杰:我认为这个“奇点”肯定还没到,而且也不算近。但过去一年通过与AI的结合,AR眼镜的产品形态确实向前进了一步。
AR眼镜的发展有几个阶段,最早期以Rokid为代表的整机厂用BB方案做的是观影大屏,它更像是一种手机配件,在这个形态下,Rokid为代表的头部公司已经将这个场景做得很好,卷到不能再卷,能买的消费者都已经买了。
下一步,AI时代来临之后,我觉得会有一个范式上的转变。正如赵总所说,眼镜的形态有独特的点——Always on,手机可能是人类历史上最强的消费电子产品,虽然当前AR的能力无法与之相比,但是随着越来越多的应用被搬上来,这个生态会越来越大,再叠加Always on这个特点,AR眼镜的价值不可估量。而这也就注定了整个过程会是偏线性增长的。
那“奇点”在哪?这可以从我们为什么要投AR眼镜说起,因为我们觉得AR眼镜最终会替代手机成为下一代计算终端。在信息传递或者信息计算这个维度上,AR眼镜会是下一代计算平台;在与真实物理世界交互这个维度来说,人形机器人可能是下一代的平台。
当站在这个角度去思考时,我们发现还是要回归到空间计算,虽然今天很多AR眼镜上已经加上了摄像头,但这些摄像头所起到的作用,就是空间语义的识别、信息的抓取,而真正的空间计算,最终是要虚像与实像投在一起、要把信息叠加在真实的物理世界上呈现给消费者,当真的能做到这一步的时候,AR眼镜才能比手机有更强的信息输出效率,才能实现替代手机,而这个终局的形态我觉得才是真正的“奇点”。
现在离这个形态当然还很远,但我们也在思考中间的步骤要怎么走,因为这个过程像是一个飞轮,要让它转起来就是一个鸡生蛋蛋生鸡的问题,到底是用户需求先起来,还是成本先下降才能让这个系统转起来?
我觉得有几个可能性:一条路径是有一个 Killer App,也就是说在计算或者显示还不成熟的情况下,整机厂找到了一个特别巧妙的应用,带动用户来使用这个设备,这也是赵总刚刚提到的、他们一直在寻找的。在这种情况下,终端大规模出货,反馈到上游就是镭昱这些公司的工程化成本会持续下降,这样整个飞轮就转了起来;另一条路径是有一个链主企业,可以无视成本下降曲线、无视需求还没有起量,就只是推一个很厉害的产品,这很像当时苹果做智能手机的路径,以前大家都设想这个链主企业可能是苹果,但现在看来苹果暂时还难以担此大任;当然,还有一条路径是等待高通这样的半导体企业算法足够成熟,能够将空间计算的这些能力装到小小的镜头中去。
当前我们还无从判断,最终究竟会是哪个路径让飞轮转起来,但总得来说“奇点”还很远,留给创业公司的时间很多,考验也很多。
黄子洋(主持人):接下来聊聊光学,光学是AR眼镜的核心技术栈之一,现在也有很多的技术迭代方案,每个方案都有差异,不过也开始慢慢收敛,行业内基本能够对最终光机的技术路线达成一致,那从光机的层面来说,完美的显示需要具备哪些特点?又要怎样做到?
庄永漳:所谓“完美的显示”,我觉得对于消费者来说是没有极限的,就像现在大家对于电视都已经不满足于4k的显示。
AR眼镜有几个局限——外形、重量、待机时间等,当前我们要做的是平衡,即在这些局限下将我们的显示做到极限。
光波导是AR眼镜很核心的一个光学零部件,刚刚也提到了,光波导本身的效率较低,且其产业化进程仍面临挑战。目前波导能量产的可能只有光栅波导,但其效率仍然有限。在过去一两年里,光波导的效率得到了显著提升,许多厂商已能够达到1000nits/lumen的水平,预计明年这一数字将再翻倍。对于微显示来说,我们也一直在提升它的水平来更好地配合光波导。
目前受限于眼镜本身重量、电池容量等层面,整体还是比较难做平衡的,短期内Micro-LED只能做一个相对比较低的分辨率来将功耗降下来,因为功耗与像素点相关,高分辨率的显示屏需要点亮更多的像素点,功耗自然就会上升。
另外一个影响显示效果的是显示屏的大小,如果要将显示屏做大,FOV(显示屏的视场角)也需要越大,才能给用户带来良好的体验。但增大FOV会导致光波导效率下降。
所以在光学层面有很多需要平衡的点,现在行业大部分从业公司比较一致的想法是,先用低分辨率的微显示屏配合30度左右 FOV 的光波导,来呈现一个信息提示类的AR眼镜,重量、外形、成本都相对比较好的符合消费者的需求。
未来是一个技术迭代的过程,等到波导 FOV 拉大、效率变高,Micro-LED持续发展,它的分辨率能在小尺寸的情况下呈现更多内容,整个消费级AR眼镜的放量才会被推动,硬件零部件的不断优化至关重要。明年开始会有一些Micro-LED+光波导的方案能达到相对比较好得显示效果,来支持AR眼镜在早期阶段实现一定规模的市场突破。
黄子洋(主持人):那么从Micro-LED的单片集成技术以及全彩的显示来看,目前还需要克服哪些技术障碍?
庄永漳:单片全彩其实有多种技术方案,镭昱一直做的是量子点色转换方案,不同的方案会面对不同的问题。单从专业的角度来说,我觉得量子点色转换是整个产业内比较容易实现高效率Micro-LED的一种方案。这个方案还有一个很大的优势,因为整个制程都是半导体集成,而半导体集成又可以基于标准的工艺来实现,所以在量产阶段,它的成本可以快速下降。我们一直专注于量子点技术的开发,基于光刻方案来实现量子点的图形化。
技术瓶颈中最核心的问题是如何在低功耗的情况下,实现与光波导的配合以达到高亮度。过往一两年波导只有200-300nits/lumen,如果配0.5lumen的光机,即便是在室内也很难达到使用标准,但随着技术进步,现在已经开始有一些1000nits/lumen的波导,这使得配0.5lumen的光机也能达到500nits的亮度水平,足够室内持续使用。我们现在已经看到,明年有些公司可以达到1500-2000nits/lumen的水平。
黄子洋(主持人):初创公司与巨头相比,有哪些优势?
庄永漳:由于资源有限,初创公司无法分散投入,因此我们在早期做出了一个重要决策——专注于色转换方案做好微显示屏。我们认为,唯有通过专注和快速迭代,才能不断提升技术能力,以超越其他公司的研发进度。
AR眼镜的大规模爆发,会推动微显示屏的起量,大公司肯定会参与进来,但大公司如果从零开始,它需要在技术上投入大量的时间,所以一般其会选择直接收购技术公司,例如三星希望在AR眼镜微显示领域发力,他们直接收购了美国OLED公司Imagine来做技术储备。
空间计算:
市场还缺一颗足够强的芯片
“低功耗+AI推理上端侧”是近期趋势
黄子洋(主持人):SoC 是限制行业发展的一个非常大的侧肘,这个层面未来会有哪些创业与投资机会?
刘天杰:国内也有一些公司在做计算相关的创业,包括像万有引力这种明星项目,大家还是从协处理芯片角度入手,去做一个低延时的、立体的、8k的芯片,并把外面的世界投到这个芯片上。协处理芯片的存在是由几个物理限制共同构成的:一个是走线,另一个是如果和主芯片放在一起,那散热问题就难以解决;以及它的算法是需要硬件固化的。它本质上其实就是解决一个专门的任务,所以也是有一些小机会,行业内近期也陆陆续续有一些出货。
但是在主芯片层面,创业公司的机会不大,因为AR眼镜对主芯片的要求比手机还要高,上一代很多人在讲“跑在手机芯片平台上”的故事,后面我们发现根本就不make sense,因为它的功耗、散热、本身的体积的限制,没办法将这样一颗芯片放在用户的脸上,所以至少在当前阶段,这就是一个无解的事情,除非有特别大的公司下定决心要做这件事情,但即便如此,我认为在一两年之内也难以被攻克。所以整机厂还是要走“沿途下蛋”的路径,将算力可以支持的端侧场景做好,端侧无法处理的就上云端。
最终还是回归到那句话,“需要有一颗足够强的芯片去支撑空间计算这个最重要的功能”。
赵维奇:我补充一下,还是回到我刚才的观点,短期内AR眼镜还会以多种形态存在,不同场景下它对 SoC 的要求不太一样,比如带屏与不带屏的、AI能力强的与弱的、带相机与不带相机的,本身算力功耗大小不一,所以对SoC的要求是不一样的,现在整机厂一般拿的是大厂的通版,就像刘总提到的,现在也有一些初创企业在与芯片厂合作,做一些针对性的解决方案,并不是一个方案解决所有问题。
再说一下AI,其实我们现在越来越倾向于把AI推理的能力放在端上,让芯片本身在端上就有这个能力,我们想降低通信的反馈延迟,因为AI本身就是要给到消费者短平快的丝滑体验,所以接下来芯片的趋势是“低功耗+AI推理上端侧”,但至于是通用化的还是半定制化的,我个人倾向于认为短期内还是存在多种形态的SOC,根据不同的场景做分化。
刘天杰 :我们看到一些手机厂也想在端侧部署模型,但手机芯片其实2B以上的模型都在端侧跑不动,所以大家想加单独的 NPU 去跑这件事,如果Rokid想在端侧去部署本地模型,会是一个多大的模型?算力要怎样部署?
赵维奇:端上的话,我觉得3B以下会更合理,更小的模型也适合,核心还是要回到产品本质看它解决什么问题,通用大模型的部分到底有多通用,以识别为例,一般来说,3B以下的模型去识别大多数的解释部分都是没问题的,但如果要识别更深的知识,可能不太能做到,另外,它推理的部分可能也没有那么强。
所以我个人觉得在眼镜端,其实并不像我们传统的手机上的一些应用形态,一定要用一样的模型类型,它会有某种垂直优化的部分、更适合在眼镜端做多模态交互的部分,对文本的要求没有那么高。
刘天杰:我理解下来你们想要部署在端侧的一些需要低延时的任务,多数在眼镜上都是多模态的,而不是纯粹的回答问题或者类似 siri 那种大语言模型的任务,所以对于模型 size 的要求本身会稍微低一点。
赵维奇:对,这也是我们最近一直在做的一件事,如何去分配端边云的算力,同时,这还与通信协议有关,就是你本身是通过什么方式来与多端沟通的,是网络通信请求还是直接 wifi 蓝牙连接终端,抑或是通过其他方式。
随着6G时代的到来,可能在端上对大模型的要求也会不一样,其实我觉得这是要持续推进的,它最终和与你接驳的算力的源头、大家的算力的分工、应用的场景等都相关。
还未出现的Killer APP:
需满足三大特点
黄子洋(主持人):我们接下来聊一聊产品形态,AR与AI的结合不管是对于AR还是AI都让下游厂商找到了一个更落地的解决方案,当前的眼镜形态是否只是AR发展过程中的一个过渡形态,对于下游品牌来说也面临着同质化的问题,要如何打出自己的差异化?
赵维奇:核心还是回到产品本质,产品的本质就是针对场景解决问题。以信息呈现和交流为核心的AR眼镜,它的形态无非是麦克风、相机、显示这几个模块做排列组合,最终会是什么形态?从我们自己的经验来说,消费者喜闻乐见的形态有几种:首先是BOSE、华为曾经做的功能类似于蓝牙耳机的眼镜,后面又加入了大模型,这是一种形态;第二是关于带不带摄像头,摄像头本身就起到了拍照录像或者是记录识别的作用,这个部分又可以分成带不带AI能力;第三,关于显示部分,有单色、多色、全彩的区分,又能呈现出很多形态。
目前其实大家都在探索什么样的形态组成出来的结果是能够被市场接受的,但市场接受不一定是因为形态,也可能是因为性价比,还可能是用户愿意一直佩戴,最早 BOSE、华为、小米的蓝牙眼镜一直比较受欢迎的原因就是它能解决部分的问题让用户一直戴着,Always on的属性其实一直是一种差异化的存在,但我们现在可能讨论更多的是偏向于多模态交互的部分。
我相信随着耳机、手表、IOT、摄像头识别通过与大模型的结合,多模态能让人类的感官有进一步的拓展,经过市场的进一步迭代后,最终会有一个比较好的差异化路线,有可能 A厂主要是做的是拍照录像、B 厂是以识别为核心、C厂综合性更强性价比更高,各品牌方最终可能会是以这样的形态存在。
黄子洋(主持人):AI 产业链上下游的一些投资机会在哪里?
刘天杰:我觉得投资于这个行业,首先是大家在终局上已经达成一个了共识——AR眼镜是下一代的计算平台,那它就是要替代手机的,是一个万亿级以上的巨大市场。
投资机会其实与刚刚讨论的,当前的产品形态是否是最终形态息息相关。
首先我认为现在的形态基本上就是最终的形态,或者更准确说是最终形态的一部分,在物理层面,最终就是眼镜的形态。把光学、芯片等一堆东西怎么置于脸上这件事已经发展了多年,最终是眼镜这个形态不会发生太多变化。
但眼镜的形态,只是提供了Always on的特性,现在大家都在此基础上叠加摄像、定位、物体识别、交流、陪伴的特性,终局可能是将今天手机的所有 feature +Always on+空间计算的显示再重新做一遍。
如果这能形成共识,那首先今天所有的组件最终都会被保留,包括光机、Micro-LED等,而且我觉得Micro-LED大概率也是最终的显示方案,镜片我不了解,不知道是否有机会,但我觉得光机是绕不过Micro-LED的,包括SoC、大模型端侧、空间计算三个层面的协处理芯片可能也有一些投资机会。
最终最大的投资机会当然还是整机,因为从一个大的消费电子品类的角度来看,最终的链主当然还是整机厂。今天手机时代的巨头也都是整机厂出身。当然这件事九死一生,面临的是这个上一代巨头的强烈的竞争。生态如何构建、内容如何构建、硬件本身要烧钱,这些都是要解决的问题,从投资的角度出发,我们要志存高远,去关注最大的投资价值点。
当然今天再去看手机产业链,其实也造就了很多显示的大的公司,AR眼镜领域可能也会有下一代的显示巨头产生,我希望这里有镭昱的位置。
黄子洋(主持人):AR 眼镜的杀手级应用是什么?
赵维奇:Killer APP是什么,是我们每天都在问自己的问题。Killer APP的核心是它所带来的价值能够让消费者付费购买产品,因为feature可以购买硬件,就像动物森友会之于switch,我目前觉得AR眼镜层面还没有出现Killer APP。
AR眼镜的Killer APP需要满足几个条件:第一,切中刚需的高频使用;第二,带来完全不一样的体验;第三,学习曲线要相对平缓。
在眼镜端,这样的Killer APP我个人觉得短时间内可能更偏向于多模态的部分,虽然现在还没看到一些Killer APP,但AI已经抛出了一些场景。比如实时翻译和跨语言交流,为什么这个层面可能会长出Killer APP,因为这个场景会打破原来人类的一大学习壁垒,就是语言学习,眼镜识别语音进行呈现,对传统的翻译机实现了一部分的提速,但是当前也存在着实时性不太够、准确性比较差、陌生人感会很强(更侧重在感知眼镜本身,人与人自然的交互很弱)的问题。
所以我个人觉得在短期内可能更多的眼镜端会倾向于一些以人为本的应用,举个例子,它解决一些非常简单明快的问题。实时翻译是一种,但它需要更实时,能快速满足用户的沟通要求,当然这部分多模态到底怎么去融合、声音和显示怎么更好地去提示和显示这些我觉得目前大多数的产品,包括我们自己还有很多需要优化的部分。
还有一个比较重要的应用,就是起到监测作用,监测用户在当前场景下的安全情况以及其他相关的信息。苹果手表上之前就增加了很多这类的监测,比如用户摔倒。配有相机的AR眼镜,如果以后的解决方案能让用户比较高频地监测当前场景,并给到反馈,那一定会是一个Killer APP。因为Killer APP就在于能给用户带来很刚需的价值、与生命等重成本的事物强相关。我们的一些“信息提示”其实就是强相关的,虽然现在手机上的提示已经比较泛滥了,但是我觉得眼镜上应该有一些轻量且重要的信息,能够与未来的车机、家庭、工作强相关。
来源:新浪科技