摘要:人工智能正在深刻改变我们的工作和生活方式。从智能手表到智能眼镜,可穿戴设备成为AI技术的重要应用领域。作为一项融合创新产品,AR字幕眼镜在辅助听障者沟通方面展现了显著的价值和潜力。图为AR字幕眼镜帮助听障咖啡师与顾客进行交流。(图 视觉中国)
人工智能正在深刻改变我们的工作和生活方式。从智能手表到智能眼镜,可穿戴设备成为AI技术的重要应用领域。作为一项融合创新产品,AR字幕眼镜在辅助听障者沟通方面展现了显著的价值和潜力。图为AR字幕眼镜帮助听障咖啡师与顾客进行交流。(图 视觉中国)
声音无处不在,正因为习惯了声音的存在,我们很难想象,失去听觉会是一种怎样的感受。人们从外界获取信息,90%是通过眼睛和耳朵。失去听力这一重要的信息渠道,不仅会影响人的言语、认知、社交能力,也会深刻影响生命的质量。
在重建听力的道路上,人类从未停下脚步。从助听器、人工耳蜗到各种医疗手段的技术跨越,生理层面上的听力障碍难题逐渐得到重视和应对。与此同时,由听力障碍所引发的生活难题也逐渐从少有人关注的角落步入大众视野。看见并解决包括听障者在内的残疾人的多种需求,成为科技发展更具温度的重要导向。
中国是全球听力残疾人数最多的国家。据第二次全国残疾人抽样调查结果显示,我国有听力障碍患者2780万人,每年新增患者超过30万人。自1995年中国完成第一例人工耳蜗植入手术,30年过去,人工耳蜗的推广应用已使我国近90%的听障儿童能够听声学语,进入普通幼儿园和学校就读。2024年,人工耳蜗被纳入国家集采,价格降幅达到75%,意味着将会有越来越多听障儿童或成年患者能用得起人工耳蜗,改善听力与生活。
伴随人工智能与医疗技术的发展,在听力康复领域,新的突破仍在不断涌现。
为了打破国外助听器品牌巨头对市场的垄断,早在2016年,中国科学院微电子研究所就成功研发出我国首款智能数字助听器SoC芯片。近年来,一些国产助听器品牌如博音听力、联影微电子等,也投身自主研发,努力突破国外芯片和算法的技术壁垒。加之互联网和人工智能企业纷纷布局听力赛道,传统市场格局进一步改变。
2024年,苹果宣布旗下蓝牙耳机AirPods Pro2新增“临床级非处方助听器功能”,在完成听力测试和软件更新后,轻度至中度听力损失的用户可直接将耳机作为助听器使用;腾讯天籁实验室推出了完全自研的助听核心算法解决方案,兼容适配各类安卓手机与蓝牙耳机;科大讯飞针对老年群体、极重度听力障碍群体相继推出智能耳背式助听器,并在产品中融合多模态字幕、深度降噪等功能。
普通蓝牙耳机与助听功能的结合,以及“AI+助听器”新模式的涌现,进一步促进了助听器的普适化和智能化发展,让助听器的功能更多元、价格更实惠。借助互联网技术,一些厂家和医院还推出了一站式远程验配服务,让患者不出家门就能完成调配,带来了极大便利。
在医学领域,“有时去治愈,常常去帮助,总是去安慰”广为流传,表达了医者对医疗技术局限性的无奈。如果说助听器、人工耳蜗都是对听障者的一种“帮助”,那么如今“治愈”也不再遥远。
长久以来,先天性耳聋一直是医学界公认的无药可治的世界难题,临床上主要的干预手段就是佩戴助听器或植入人工耳蜗,但在恢复自然听觉等方面都有所局限。
“沐沐,沐沐……”2024年10月,在北京协和医院的听力检查室,患有先天性耳聋的两岁女孩沐沐听见妈妈的呼唤,不时转过头来。此前,沐沐接受了北京协和医院开展的首例耳聋基因治疗,随访检查结果显示,沐沐的各项听力检测指标都有明显提升,对声音的敏感度逐渐提高。
将沐沐带回有声世界的就是“先天性耳聋基因疗法”,由复旦大学附属眼耳鼻喉科医院耳鼻喉科研究院副院长、遗传性耳聋诊治中心主任舒易来牵头研发。这一治疗方法针对OTOF基因突变导致的遗传性耳聋,通过修复或替换这一基因缺陷,从根本上恢复患者的自然听力。相对于人工耳蜗,经过基因疗法治疗的患者能够感知自然声音,包括复杂的音乐和环境声音,而不再依赖外部设备。
术后仅20天,曾经处于寂静世界的沐沐就对声音产生了反应。在奶奶录制的视频中,她试图用并不太流利的声音召唤一只宠物猫。“来!”简单的字眼,满载着对声音世界的无尽好奇。
沐沐并非唯一一个接受基因治疗的患者。自2022年启动临床试验并进行首例基因治疗,现在已经有十余例患儿接受治疗,研究团队已在术前术后建立起一套相对成熟、系统的治疗方案。
2024年1月,作为全球首个遗传性耳聋基因治疗临床试验,研究成果发表于世界顶级医学期刊《柳叶刀》。封面评论上写道:“突破性研究为治疗儿童听力障碍提供了范式转变,并为治疗其他遗传性听力损失带来了希望。”基因治疗听力障碍的新时代正因这项由中国医生主导的研究而开启。
在“改造”耳朵的历程中,弥补或治愈的每一步,都凝聚着国家的力量、科技的进步与社会助残观念的转变。科技所带来的影响,不仅在于耳朵的延伸,让曾经模糊不清的声音变得清晰可辨,也搭建起了一座座连接人与人、世界与世界的桥梁。
在2025年的除夕夜,许多听障朋友第一次同步“听见”了春晚。得益于AR技术与AI技术的使用,在春晚的无障碍转播中,听障者不仅能观看手语演员精彩的解说,还能看到准确流畅的实时字幕,弥补了曾经在这场全民联欢中“置身事外”的遗憾。
作为一门语言,手语的表达习惯及思维方式与口语、书面语都有很大差异,这让听障者与健听者在交流中障碍重重。越是“不被理解”,使用手语的听障者就越习惯于生活在相对封闭的社交圈内,从而加剧社会隔阂,使得听障者与健听者面对面,却如同站在玻璃墙的两端,听不见对方的声音。随之而来的后果是,很多听障者时常不明白自己得了什么病、不知道如何办理社保、不清楚怎样维权……为了打破这堵玻璃墙,同时帮助更多残障者无碍沟通,推进信息无障碍的政策相继出台,进一步推动了手语与算法的结合。
王建源是在听障家庭长大的重度听障者,也是天津理工大学“手语实时翻译系统”研发团队的成员之一。因为吐字发声困难,手语是他成长过程中最主要的交流方式,对于听障者生活“方方面面”的不便,他深有体会。为了实现“将手语实时翻译为语音或文字”的理想,他和学校师生组成团队,在近5年时间里,构建起包含30余万条视频的语料库。
2021年,王建源和团队带着完成的“手语实时翻译系统”参加了世界智能大会,令不少人驻足称奇。它覆盖了教育、出行、法律咨询等常用或必要的应用场景,只要在摄像头前打出手语,一旁的显示屏就会出现语意连贯的文字翻译。
一位听障者面带笑容,两只手交替挥舞,一旁的显示屏随即显示出“阳光总在风雨后”的文字……如同“52赫兹鲸”的语言密码被破解,让沉寂在人海中的手语使用者拥有了“被听懂”的可能。
在天津理工大学聋人工学院,很多师生本身就是手语使用者,在手语数据的采集评估方面独具优势,因此,一些企业在AI手语项目研发时积极与其合作。百度智能云团队就在其列。
2022年北京冬奥会、冬残奥会期间,一款“真人般”样貌的AI手语主播在央视新闻正式上岗,即由百度智能云团队和天津理工大学聋人工学院等联手打造。“她”在赛事期间全程陪伴听障群体,完成了一场又一场精彩报道。
上岗前,为了测试“她”的专业能力,一向妙语连珠的央视主播朱广权与其在线battle——“短道滑,花样滑,滑雪滑冰出溜滑;掷冰壶,一手抓,我刷我刷我刷刷刷……”面对朱广权的超高速顺口溜,AI手语主播轻松应战,表现出色,以“残影级”的手速赢得了肯定。
国内手语数字人技术自2013年起步,2019年后进入爆发增长期,据不完全统计,仅2021年至2022年两年间,就有华为、阿里达摩院、腾讯、VIVO等9家企业或研究中心推出了手语数字人。尽管这些手语数字人的现实表现仍存在一些质疑,距离让听障者完全“看懂”还有差距,但正如北京师范大学教授郑璇所言,“中国在手语数字人研发领域已领先于世界,众多手语数字人产品已在电视新闻、公共服务、重大赛事活动、聋校教学等场景落地应用。”
在湖南省长沙市开福区政务中心,来自吉林的听障姑娘李丽通过“千博手语双向无障碍沟通平台”,不到半小时就办好了残疾人证异地换新的业务;在安徽,合肥综合性国家科学中心人工智能研究院研发出手语大模型SignBERT,即将与合肥市12345热线合作,推出一套视频手语问答系统。此外,百度智能云也发布了“曦灵AI手语平台”“AI手语平台一体机”,为医院、银行等公共场景下快速部署无障碍窗口提供可能。
这些会打手语的数字人,不仅能帮助听障者获取信息,走出手语困境,也在这个人工智能时代里,为社会看见残障者及其需求提供了重要指引。
2007年,原中国聋人协会副主席富志伟在《中国残疾人》杂志发表文章《我看“聋人信息无障碍”》,文末写道:“我期望将来能研制出一种机器,它可以和现在的微型摄像机一样大小,一端输入口语,另一端小屏幕上即显示文字……是神话吗?不是。是梦想吧?是的。”
“以前我出门,会带一支笔和一个本子,遇到需要沟通的时候,就写下来。但是这样感觉不是很方便,所以就不经常出门了。有了讯飞听见以后,对方说的话会转写成文字,我也可以轻松地表达我的想法,沟通顺畅多了。”中国残疾人艺术团舞蹈演员魏菁阳说。
2019年,科大讯飞联合中国聋人协会、中国残疾人艺术团等发起“听见AI的声音”公益项目,为听障者提供免费的实时语音转文字服务。到2023年底,讯飞听见App便累计提供了超1亿分钟的免费转写服务。“讯飞听见的主要优势是识别准确率高些,并且支持更多的地方方言。”创业者田野说,他和身边的听障朋友都是这款App的使用者。
与讯飞听见类似的应用,正在持续涌现,并在功能设计上不断趋近使用者需求。一位网友在社交媒体上对一款名为“听话小黑板”的App连连称赞,因为这款应用功能简单、字体醒目,对失聪多年的母亲十分友好。听障者YoYo则专门写文章分享了荣耀产品的离线AI字幕功能,因为工作原因她经常参加会议,涉及保密内容时,会场会进行信号屏蔽。“每当遇到这种会议我就很郁闷,完全不知道会议讲了什么,回去以后还得找同事咨询会议内容。”离线功能则在信号屏蔽、飞机飞行等特殊场景下,缓解了听障者的尴尬处境。
此外,语音转文字技术与AR技术融合,催生了更具科幻色彩的“AR字幕眼镜”。与手机转译相比,AR字幕眼镜优势更加突出,它不影响对话视野,不暴露屏幕显示内容,甚至能帮听障者“听”到背后的呼唤。
“我等待这个盒子里的技术很多年了。”当拿到自己的AR字幕眼镜,听障博主克瑞丝一边笑一边流泪,比着手语“说”道。AR字幕眼镜在外形上和普通眼镜别无二样,可戴上它,在语音环境里,便能看到一行行充满科幻感的亮绿色字幕,除了可以用来对话交流,还能用来看电影、追剧、玩剧本杀等,同时不被看出听力上的不便。
在科技的赋能下,不会手语的普通人能“看懂”手语表达、普通人说出的话能被听障者“听见”,沟通屏障被一一打通,因交流所产生的火花正逐渐照亮生活的每处角落。
在上海“熊爪咖啡”,听障咖啡师们能够戴着智能手环,实现无障碍接单作业;在城市的大街小巷,无声骑手们借助外卖平台的关怀功能,为千家万户送去美味;在博物馆,不理解文博专业词汇的听障者,扫描二维码就可以观看手语讲解,读懂文物的历史;在面试、购物、结交新朋友的每一处,口语不够标准的听障者通过手机“声音修复”功能,能够清楚地表达,畅快地生活。
从助听器到AI,从“有声有色”到“绘声绘色”,科技发展重塑了听障者的工作和生活方式,并以其温暖而强大的力量,带来前所未有的便利与希望。曾经,我们努力让听障者离有声世界近一点。如今,世界正以更包容的姿态,主动向听障者靠拢。
记者:吴丽君
编辑:艾伯宁
审核:张雪飞、张競丹
来源:中国残疾人联合会