摘要:布宜诺斯艾利斯—阿根廷总统哈维尔·米莱伊上任第一年,便以其独特的言语风格吸引了全球目光。据阿根廷《国家报》(La Nación)一项开创性的调查显示,在执政首年,米莱伊接受了58次长时间媒体采访,并发表了84次正式讲话,音视频总计长达89小时。
布宜诺斯艾利斯—阿根廷总统哈维尔·米莱伊上任第一年,便以其独特的言语风格吸引了全球目光。据阿根廷《国家报》(La Nación)一项开创性的调查显示,在执政首年,米莱伊接受了58次长时间媒体采访,并发表了84次正式讲话,音视频总计长达89小时。
在全面记录了米莱伊这段时间的所有讲话后,这家阿根廷主流报纸利用人工智能(AI)技术,对这73.9万个单词进行了转录和深入分析,旨在识别这位政治家的独特语言模式:从他对对手、国家和媒体的攻击性言论,到他频繁重复的短语。最终成果是一篇题为《米莱就是这样对我们说话的:自由主义叙事构建新常识的9个技巧》(Así nos habló Milei: 9 trucos del relato libertario para construir un nuevo sentido común)的特别报道,引发了广泛关注。
《国家报》执行主编兼专栏作家马丁·罗德里格斯·耶布拉在接受《拉丁美洲新闻评论》(LJR)采访时表示:“米莱伊在没有传统政党支持、机构权力极小、且缺乏深厚历史背景的情况下就任总统。他的权力尤其源于他的言论。他是一位非常注重沟通的领导人,我们认为,梳理他的言论特征至关重要:是什么让他的言论如此独特,他最常用的‘伎俩’是什么,他是如何构建一个能够克服自身政治弱点的‘史诗’的。因此,我们开始收集他所有的演讲和采访,希望基于客观、可量化的数据进行分析。”
《国家报》的报道列举了米莱伊演讲的九大显著特点,其中包括频繁使用侮辱性语言——在130次演讲和采访中,共出现了超过4000个贬损性表达;构建其作为继承性灾难中“救世主”的形象;以及反复运用夸张手法等。
“最令人惊讶的是,他竟然如此频繁地侮辱和攻击他的对手、媒体和公众人物,这些人虽然不是他的敌人,但表达的立场却与他不同,”罗德里格斯·耶布拉透露,“我们知道这种情况很常见,但我们没想到仅仅一年时间就能识别出4000多起此类攻击。”
该项目还重点分析了米莱伊对新闻界的系统性攻击。根据《国家报》的分析,在69次演讲和采访中,共记录了410次对新闻业的贬损言论。
调查结果显示,在对新闻从业者进行“取消资格”的词语排名中,“骗子”(liar)是被提及最多的词。
报道进一步指出,在过去一年中,米莱伊总统平均每天使用冒犯性词语“取消”了60多名记者的“资格”,他用“腐败”(corrupt)、“悲惨”(miserable)、“怨恨”(resentful)、“暴君”(tyrant)、“骗子”(liar)、“暴徒”(thief)和“诈骗犯”(swindler)等词语狂轰滥炸。
“从一开始就很明显,对媒体的系统性攻击是米莱伊言论的核心特征之一,”罗德里格斯·耶布拉说道,“阿根廷从未有一位总统对媒体如此咄咄逼人。我们的目标是找出规律来理解这种行为:他使用什么样的词语,何时最具攻击性,以及在哪些问题上反应最激烈。我相信,这些分析能让我们更好地理解,这是一种在某些政治需要时刻启动的策略,而非简单的自发反应。”
为了深度解读总统的沟通风格,一个由14名专业人士组成的多学科团队,从构思到文章发表,共耗时约两个月。团队成员涵盖政治分析师、人工智能专家、程序员、数字设计团队、视频编辑以及总编辑等。
罗德里格斯·耶布拉强调了人工智能在项目中的关键作用:“我认为,如果没有人工智能,就不可能量化米莱伊在执政第一年里说过多少侮辱性的话,或者,也不可能准确地确定他的演讲中有多少夸张成分。我认为,人类不可能像这项工作一样,从数十个小时的语音中提取出定量且精确的信息。”
La Nación 团队
《国家报》人工智能实验室的开发人员马丁·帕斯夸详细解释了此次项目开发过程的几个明确阶段。
第一阶段的工作由罗德里格斯·耶布拉领导的编辑团队负责,他们收集了米莱伊上任第一年发表的100多个演讲和采访视频。随后,运营和DevOps团队将所有素材上传到谷歌云平台(GCP)。
“从那时起,我们开始评估处理视频的最佳技术策略,”帕斯夸告诉《LJR》,“我们之前有过一些项目的经验,比如2023年10月的总统辩论现场分析,但这次我们的工作规模更大,文件更长,数据量也大得多。而且,从那个项目到这个项目,间隔了将近12个月,就生成式人工智能的演进而言,这已经是一段很长的时间了。”
帕斯夸表示,在选定最佳AI模型之前,团队对多种方案进行了受控测试,包括Google Speech、OpenAI的Whisper API、本地运行的Whisper以及通过Vertex AI运行的Gemini。最终,他们选择了本地运行的Whisper Large v3进行转录,并使用Gemini Pro进行内容处理和分析。
“我们的标准是平衡转录质量、处理速度和运营成本——尤其是考虑到我们处理的是100多篇演讲,其中很多篇幅都很长,”帕斯夸说道,“Whisper Large v3为我们提供了最佳结果。它让我们避免了API使用成本,同时提供了卓越的转录准确性,尤其是在说话人区分方面,这对于话语分析至关重要。在我们自己的硬件上运行它,也让我们能够完全控制整个流程,并灵活地根据需求定制环境。”
帕斯夸指出,Gemini Pro在质量、速度和成本之间实现了完美的平衡。团队使用该工具纠正了残留的转录错误,对文本进行了标准化处理,为结构化分析做好了准备,探索了对相关摘录进行分类和分组的不同策略,并与编辑团队合作,对不同的主题角度进行了迭代。
帕斯夸表示,在获得米莱伊的演讲记录后,团队编写了一个Python脚本来清理自动语音识别中的常见错误,例如标点符号问题、说话人标签和填充词。他们还使用Streamlit开发了一个小型应用程序,可以快速上传和浏览文本,以方便质量控制。
所有文字记录完成后,编辑团队开始确定关键主题重点。与此同时,信息图表和数字设计团队也加入进来,将研究结果转化为清晰、有影响力的视觉叙事。
“设计团队与视频团队合作,找到了一种引人入胜的信息呈现方式,”罗德里格斯·耶布拉说道,“我们测试了多个模型,最终找到了最喜欢的一个,它让我们能够看到演讲中每个变量随时间的变化,以及总结主题的短视频片段。”
帕斯夸说,在确定并验证了米莱伊演讲的所有关键点后,团队进行了另一轮处理,以量化其发现,并以结构化的格式将其提交给设计团队,设计团队随后制作了已发布的可视化结果。
“作为一名开发人员,这是这个项目最让我受益匪浅的部分之一:观察记者如何处理海量文本,如何浏览、比较和提取含义,这真是一次真正的学习体验,”他说道,“团队活力是整个项目中最令人欣慰的方面之一。这是一次真正的协作,来自不同背景但高度互补的团队为了共同的目标而共同努力。我个人认为,这种开发人员、记者和设计师之间的互动,是当今新闻编辑室工作中最让我受益匪浅的部分之一。”
尽管技术已经非常先进,但两位专业人士都强调,人类新闻工作者对于保证人工智能获取信息的准确性和背景性至关重要。
“或许这项工作最复杂的部分是验证人工智能从米莱伊的演讲中提取的数据是否准确,”罗德里格斯·耶布拉说道,“我们反复审查了这些回答,确保它(人工智能)能够解读米莱伊非常具体的语言。我们希望数据非常精确。之后,我们还进行了多次讨论,探讨如何呈现信息,以及为了清晰起见,哪些内容需要省略。”
帕斯夸强调,人工审核是整个流程每个阶段不可或缺的一部分。团队实施了多项机制以确保质量,包括清理和修正脚本以修复常见的转录问题,以及内部审核工具,使内容更易于浏览。据开发人员介绍,团队还创建了跨团队验证工作流程。技术团队对结果进行了结构性审核——包括格式、完整性和处理完整性——而编辑团队则对结果的含义、语气、来源准确性和新闻相关性进行了审核。
“从最初的转录到最终输出,我们与编辑团队密切合作,确保数据保持一致,忠实于原始内容,”帕斯夸说道,“这种自动化与人工监督相结合的混合验证流程,是提供稳健可靠结果的关键。它不仅使我们能够纠正技术错误,还能在处理材料的过程中不断调整编辑重点。”
今年5月初,《国家报》的项目获得了世界新闻出版商协会(WAN-IFRA)颁发的“新闻编辑室最佳人工智能应用”奖。
据评审团称,《国家报》在作品中使用人工智能,达到了只有先进技术与新闻严谨性相结合才能达到的深度和精确度。
评审团表示:“它的实施显然促进了新闻报道更具影响力和洞察力。”
罗德里格斯·耶布拉表示,他希望该项目的认可将激励《国家报》和其他媒体的编辑团队更多地利用人工智能工具,不仅用于分析当局的言论,还用于一般的新闻调查。
“我们正在努力开发一些工具,让我们能够更简单、更快速地进行此类分析,”他说,“这些工具可以应用于特定的话语,并且可以实时应用。我认为可能性无穷无尽。”
对于帕斯夸来说,从技术角度来看,开发人员在新闻编辑室中的角色正在迅速演变。他认为,开发人员不再仅仅是用工具“支持”编辑团队,而是积极参与调查本身,提出收集、处理和利用数据讲述故事的新方法。在一个大多数信息都数字化、海量且不断变化的世界里,他表示,开发人员和记者之间的合作对于开展深入且有影响力的调查至关重要。
“应用语言模型、数据抓取技术、自动化、交互式可视化或实时验证的能力,开启了几年前难以想象的叙事可能性,”帕斯夸说道,“因此,我相信这个职位不仅会继续发展壮大,而且会变得越来越专业化——拥有了解编辑需求的开发人员、技术娴熟的记者,以及使用共同语言的混合团队。在我看来,这正是调查性新闻最有前景的未来所在。”
来源:日新说Copernicium一点号