摘要:无需耳机也能实现私密收听?也许有一天你可以像电影《沙丘》中的声音屏蔽场那样,就算没有佩戴耳机也能在不打扰周围人的情况下,以“裸耳形式”收听自己喜欢的播客或歌曲。
无需耳机也能实现私密收听?也许有一天你可以像电影《沙丘》中的声音屏蔽场那样,就算没有佩戴耳机也能在不打扰周围人的情况下,以“裸耳形式”收听自己喜欢的播客或歌曲。
近日,来自美国宾夕法尼亚州立大学的研究人员创建了一种远程音频点,并将其命名为可听声域。其具备 125Hz 至 4kHz 的宽带,并具有高度本地化的特点,能够精确地缩小声音被感知的范围。
本次技术的实用性体现在:其实施尺寸为 0.16 米,这一长度相当于 125Hz 下 0.06 个波长。在宽带瞬态音频信号激励下,其能在包含混响的普通房间内发挥稳健的性能。
为了验证本次技术的有效性,研究人员使用了一个躯干假人,其耳朵内装有麦克风,以便模拟人类在超声波束轨迹上各点所听到的声音。
同时,他们使用第三个麦克风来扫描交叉区域,借此确认除了交叉点之外声音是不可听的,从而证明确实形成了可听声域。
研究团队通过数值分析和相关实验,验证了这种基于超表面的方案的超宽带能力,证明其频率范围为 125Hz 到 4kHz,覆盖了大部分可听频率范围。
在具有正常混响的普通房间中,研究人员针对本次系统进行了成功测试,这意味着该技术能被用于教室、车辆甚至户外等多个场景。
对于这种可听声域技术来说,它各种高级音频工程应用中具有巨大潜力,包括用于私人语音通信、沉浸式空间音频再现以及用于高分辨率声音和静音区控制等。
在公共场所比如图书馆或博物馆,音频隔离区可以为特定群体提供声音,而不会打扰其他人。它甚至有可能被用于整个区域的噪音消除为噪音污染的城市带来宁静。
可听声域:堪比“虚拟耳机”,能打造有声区和无声区
实质上,研究人员等于造出了一款虚拟耳机。对于在可听声域内的人来说,他们能够听到仅仅针对自己的声音,从而可以实现有声区和无声区的区分。
也就是说,用于创建可听声域的超声波在传播的路径上无法被听到,甚至可以通过弯曲来避开障碍物。只有当它们到达目的地时,人耳才能接收到声波。
目前,研究人员能将声音以远程方式传输到距离目标大约一米远的地方,声音音量大约为 60 分贝,这相当于人类正常说话时的音量。
有了这一技术,无论我们身处于封闭空间(比如车内),亦或是直接站在声源前,只有站在可听声域里的听众才能听到声音,而站在附近的其他人却听不到。也就是说,即便一个的声音穿过熙攘人群,但是最终只会被一个人听到。
据了解,研究人员通过发射两束非线性超声波产生了可听声域。在这些可听声域里,声音只有在两束超声波的精确交叉点才能被感知到。
研究中,研究人员使用两个超声波换能器与一个声学超表面配合,它们会发射出在某一点相交的自弯曲超声波束,这时就等于打造出一个隐私屏障,能够实现私密的聆听。
假如途中遇到障碍物,又该如何应对?这时,另一项关键创新便派上用场:可弯曲的超声波束。超表面能在声波传播过程中精确地操纵其路径,其工作方式类似于光学透镜弯曲光线的方式。
研究中,他们通过略微不同的频率来投射每个光束。例如,一个光束的频率为 40000Hz,另一个光束的频率为 39500Hz。当它们相交时,交叉的光束会产生一个新的声波,其频率等于两束光之间的频率差。
在这种情况下,产生的声波频率为 500Hz,恰好处于人类听觉的中频范围内。中频范围,指的是频率范围在 200Hz-2kHz 之间的频段。这个频段包含了很多人耳听起来比较清晰和明亮的声音成分。
通过将超表面放置在两个换能器前面,超声波会以两个略有不同的频率沿着新月形轨迹传播,直到它们相交。
这两束光本身都是不可听的,但是光束可以绕过障碍物比如人的头部,进而到达指定的交叉点。只有当它们交汇在一起时,才会产生局部非线性相互作用,从而产生可听的声音。
虽然人耳听不到由声学超表面产生的自弯曲超声波束,但是自弯曲超声波束可以绕过人体头部等障碍物。
在障碍物后的交叉处,由于局部非线性相互作用,能够形成一个高度局部化的可听声域。
总的来说,通过结合局部声学非线性效应以及自弯曲超声波束,并利用具有不同光谱的两个自弯曲超声波束的局部非线性相互作用,让本次技术克服了线性声学的物理限制,为未来音频工程的可能性铺平了道路。
可听声域:诞生于一片“未被开垦的领域”
对于现代多区域声音再现技术来说,它的最终目标是为多个听众提供个性化、无界面的音频,以便最大限度地减少对于其他区域的干扰,同时完全无需物理隔离,也完全无需使用耳机等可穿戴设备。
在研究相关课题时,领域内的研究人员经常要在复杂的声学混响环境中,比如在房间或在汽车驾驶舱中创建个人声音区或静音区。但是,墙壁反射和人体头部等障碍物的散射会带来诸多挑战。
而只有克服这些挑战,才能实现私密语音通信、实现无串扰和溢出效应的空间音频,以及实现有效的主动噪声控制。
在先进波前工程(Advanced Wavefront Engineering)领域,自弯曲超声波束是近年来的一项研究重点,并为解决上述问题提供了潜在解决方案。
自弯曲超声波束,是一种特殊的超声波束,它具备抗干扰的特点,当它沿着曲线轨迹传播的时候可以绕过障碍物。
凭借这一独特性质,让其已被用于非接触式物体操控和非侵入性生物医学成像等领域。
在音频工程领域此前已有研究证明:自弯曲超声波束能将音频内容传输到人类头部周围。
但是,由于长波音频波的衍射特性,这不仅需要庞大的声源,还得使用昂贵的数字信号处理平台。
例如,此前有一项研究的实验要求声源尺寸为 2.6 米,以便能在波长为 8.6 厘米的 4kHz 声波下绕过半径为 0.1 米的人头,同时还得在 64 个通道上开展大量的信号处理。
而在波长为 3.43 米、低至 100Hz 的音频频率上实施这些技术,则会面临更大的挑战。因为,这不仅需要更大的声源尺寸。并且,由于波长较长导致在普通房间内更容易受到声学混响的影响。
即便如此,声束轨迹上的声音仍然是清晰可闻的,因此很难将其用于对于隐私性要求较高的应用中。
从本质上讲,正是由于声波衍射的存在,导致尖端音频工程技术的进一步发展面临着根本性的物理限制。
为了克服声波衍射,人们曾提出各种基于线性声学的技术,包括超材料、超振荡和时间反演聚焦等。
近期,领域内开始使用一种名为非线性声学的新方法被引入,以便进一步增强声波的亚衍射控制。
由于声波控制方程的固有非线性特性,导致在声学中普遍存在着非线性效应。
在声学中最常见的二次非线性现象中,当发射两个频率分别为 f1 和 f2 的主波时,会产生一个二阶非线性分量即差频波(DFW,difference-frequency wave),其频率为 f = |f1 − f2|。
这种操作的好处在于:它能绕过线性声学中对于差频波施加的衍射限制。当差频波落在可听频率范围之内,但是主波是不可听的超声波束时,这一操作将在音频工程中变得尤为有益。
对于非线性声学效应来说,它存在两种截然不同的类型:累积非线性效应和局部非线性效应。
累积非线性效应源自于特定介质的非线性参数,并已被广泛用于生物医学成像等领域。
局部非线性效应,则由主波的局部拉格朗日密度决定,但是这一效应也经常被人忽视。(注:拉格朗日密度(Lagrangian density),是理论物理中的一个重要概念,在经典场论和量子场论等领域有着广泛的应用。)
与此同时,对于以上两种非线性声学效应来说,此前均未有人将其与声学中的自弯曲超声波束进行结合,因此这仍是一个未知领域。
正是针对这一未开垦领域的尝试,让研究团队以概念化的方式,实施并展示了可听声域的创建。
将使用深度学习减少非线性失真
对于可听声域来说,它是通过由亚波长超构表面和波源产生的两束超声自弯曲波束之间的局部非线性效应的相互作用来实现的,故能突破线性声学中衍射效应所设定的基本限制。
实验中,光束能够绕过一些障碍物,这些障碍物包含圆柱体以及类似人体头部的形状,绕过之后会在障碍物后方形成一个高度局部化的可听声域,同时还能保持不可听轨迹。
为了促进自弯曲超声波束的产生,研究人员使用了 3D 打印的声学超表面。
尽管在线性声学领域声学超表面通常与窄频带相关,但是本次研究表明当将声学超表面用于非线性声学领域时,它可以实现极佳的超宽带性能,其频率范围涵盖 125Hz 到 4kHz。
之所以能实现上述高性能是因为:在超声频率下的一个窄频带内操控波,能够在音频领域转化出来一个较宽的频率范围。
在研究人员所打造的紧凑型实现方案中,其源孔径尺寸仅为 0.16 米,相当于 125Hz 下 0.06 个波长,远远胜于基于线性声学的方法。
此外,通过在普通房间内针对瞬态宽带音频信号激励下的可听包围区进行观察,研究人员证明了该技术对声学混响的鲁棒性。
总的来说,通过将局部声学非线性与听不见的自弯曲超声波束相结合,研究团队成功创建了一个可听声域,其能用于向目标区域远程传输声音内容,同时不会对听众造成干扰,甚至在声束传播路径上也是如此。
这一技术融合了自弯曲超声波束、非线性声学和超表面,为音频工程的发展提供了更多可能。
通过抵消原始噪声场,这种可听声域或可用于创建静音区,同时对于周围区域的影响也能降到最低。
目前,可听声域依然存在非线性失真的不足,从而会导致音频质量不佳,尤其是在高保真宽带声音再现方面。
这种失真源于本次技术的固有非线性特性。但是,研究团队相信通过利用经典非线性滤波器和数据驱动的深度学习方法的非线性补偿技术,将有希望减轻这种失真。
参考资料:
运营/排版:何晨龙
来源:DeepTech深科技