摘要:啁啾、颤音、低吼、长嚎、尖鸣。动物以千奇百怪的方式交流,但人类对其沟通机制的理解仍停留在表面。我们驯化过某些动物(若问猫咪,它们会说是动物驯化了人类),却从未真正破解跨物种交流的密码。
当科学家运用机器学习解码鲸鱼、狗和海豚的声音时,关于技术应用的争议正在浮现。
啁啾、颤音、低吼、长嚎、尖鸣。动物以千奇百怪的方式交流,但人类对其沟通机制的理解仍停留在表面。我们驯化过某些动物(若问猫咪,它们会说是动物驯化了人类),却从未真正破解跨物种交流的密码。
如今,动物研究者正越来越多地借助人工智能加速探索动物通讯 —— 无论是同物种之间还是生命之树的不同分支之间。随着科学家逐步破解动物复杂的通讯系统,他们距离理解生物的语言(甚至回应它们)越来越近。但就在人类试图弥合与动物间的语言鸿沟时,部分专家提出了伦理质疑:这种能力是否恰当?我们究竟该不该尝试与动物对话?
AI破解动物语言的尝试
领跑这项研究的"鲸类翻译计划"(CETI)通过机器学习分析了多米尼克抹香鲸项目记录的8000多个"咔嗒声码" —— 这些结构化的点击模式被研究者发现具有语境组合特征。团队用"弹性节奏""装饰音"等术语描述鲸鱼对话时的声音微调,最终构建出类似语音字母表的表达体系。虽然这套系统不同于人类语言,但其复杂性远超学界预期。鉴于用AI"对话"可能带来的风险,该项目正在制定相关伦理准则。
谷歌与野生海豚项目近期联合推出了DolphinGemma大语言模型,该模型基于40年的海豚发声数据训练。就像ChatGPT能处理论文图像等视觉信息并生成回答,DolphinGemma能预测海豚的后续发声,甚至合成类海豚音频。配套的双向通讯系统CHAT(鲸类听觉增强遥测技术)已能让海豚通过智能手机界面索取围巾或海草 —— 这为未来跨物种对话奠定了基础。
"本季我们正使用DolphinGemma优化CHAT系统的实时声音识别,"项目创始人丹妮丝·赫尔辛表示,"秋季将重点分析求偶、母子管教等场景中的重复发声模式。"这项AI技术既能解析海豚自然发声,也能帮助理解它们对人类模拟声的反应。
陆地动物的AI解码
在海洋之外,研究者发现人类语音模型同样适用于陆地动物。密歇根大学团队利用人声训练的Wav2Vec2模型,仅通过犬吠就能识别情绪、性别、品种甚至个体身份。这个预训练模型的表现优于纯犬类数据训练的版本,暗示人类语言架构在解码动物通讯中可能具有惊人潜力。
当然,AI模型的解析难度存在差异。判断犬吠的攻击性或性别,显然比破译抹香鲸语音的微妙含义简单得多。但每项研究都在推动AI工具在这个广阔领域的应用,并让AI通过训练成为更有效的研究助手。
就连高冷的猫咪也比表面更善交流。巴黎南泰尔大学2022年研究发现,家猫不仅能识别主人声音,当人类使用"猫语"直接交流时,它们的反应会显著增强。本月初,乌贼研究者还发现这种生物会用四种"波浪舞"进行种内交流,并对人类播放的乌贼动作视频作出反应。
科技企业也在积极入场。百度近期向国家知识产权局申请的专利显示,其正在开发将猫叫声翻译成人类语言的技术。该AI通过分析大量猫科动物发声数据,判定情绪状态后输出对应的"人话"。
动物界的罗塞塔石碑?
这些研究标志着科学家探索动物通讯方式的重大转变 —— 团队不再从零开始,而是改造现有人类模型,取得了原本需要更久才能实现的突破。终极目标或许是AI驱动的"动物语言罗塞塔石碑"。
"过去五年我们在人类语言分析上突飞猛进,现在正完善模型迁移技术,"地球物种计划的行为生态学家萨拉·基恩表示。该组织今年将推出旗舰动物语音模型NatureLM,其演示版已上线。通过整合生命之树各分支的发声数据、人类语音甚至环境音效,该模型试图实现人声到动物模拟声的转换,初步验证了"AI共享表征可助力破译动物语言"的假设。
"我们工作的核心是改变人类对自身地位的认知,"基恩补充,"动物通讯研究不断带来惊喜,最终我们会发现其他物种同样复杂精妙 —— 这个认知本身就令人振奋。"
伦理困境
尽管学界普遍认可AI在动物通讯数据解析上的潜力,但公众对技术应用的认知存在偏差。"当前报道中存在严重误解,仿佛机器学习能无中生有地创造语境知识,"国际生物记录学会创始主席克里斯蒂安·鲁茨指出,"但意义只能来自行为生态学和自然史的专业标注。"
随着技术发展,动物权益讨论必须同步进化。专家已提出优先保障动物福利的伦理准则,法律学者甚至开始思考"让动物成为权益讨论参与者"的可能性。
近期关于AI与鲸类交流伦理的论文列出了六大问题领域:隐私权、对鲸类的文化情感伤害、拟人化倾向、技术万能论、性别偏见,以及对鲸类保护的实际效果有限性(最后这点尤为紧迫,因为许多鲸群已濒临灭绝)。
我们正站在认知动物交流方式的突破边缘 —— 揭开这层帷幕或将揭示它们的学习、社交及环境适应机制。但如何运用这些强大技术,仍是人类需要慎思的重大命题。
来源:知新了了一点号