LLM近一半回答在扭曲真相!ChatGPT、Gemini全部顶流模型统统中招

B站影视 日本电影 2025-10-27 19:37 3

摘要:BBC与欧洲广播联盟最新研究揭露了人工智能新闻助手的严重问题——在对全球四大主流AI平台进行的大规模测试中,高达81%的回答存在不同程度的错误,其中45%包含重大失实信息。这项涵盖18个国家、14种语言、3000个新闻相关问题的综合评估,为AI技术在新闻领域的

BBC与欧洲广播联盟最新研究揭露了人工智能新闻助手的严重问题——在对全球四大主流AI平台进行的大规模测试中,高达81%的回答存在不同程度的错误,其中45%包含重大失实信息。这项涵盖18个国家、14种语言、3000个新闻相关问题的综合评估,为AI技术在新闻领域的应用敲响了警钟。

研究团队对ChatGPT、Copilot、Gemini和Perplexity四大AI助手进行系统性测试后发现,错误并非偶发现象,而是跨越语言、地区和平台的系统性问题。更令人担忧的是,这些AI助手的"拒答率"已从半年前的3%骤降至0.5%,意味着即使面对不确定信息,它们也倾向于给出看似权威但实际错误的答案。

虚假权威的危险游戏

此次研究由来自法国、德国、西班牙、乌克兰、英国和美国等18个国家的22家公共媒体机构共同参与,评估了AI助手在新闻准确性、信息来源可靠性以及区分事实与观点能力方面的表现。结果显示,这些AI系统最严重的问题集中在信息来源方面,近三分之一的回答存在来源错误,包括遗漏关键信息、提供误导性引用或完全错误的署名。

在具体表现上,谷歌的Gemini表现最为糟糕,72%的回答存在来源错误,总体错误率高达76%。更令人震惊的是,部分AI助手甚至伪造新闻链接或将讽刺节目作为事实来源引用。例如,当被问及"NASA宇航员为何被困太空"时,Gemini回答称这是"误解,可能把科幻电影当成新闻",而事实上当时确实有两位宇航员因飞船故障滞留九个月。

准确性问题同样严重,约20%的回答包含过时或错误信息。ChatGPT在方济各去世数月后仍称他为"现任教皇",Gemini误报英国"一次性电子烟法规修改",Perplexity在报道捷克代孕法时甚至直接"立法造句"。这些错误不仅误导用户,更可能对政策理解和公共决策产生深远影响。

信任危机的连锁反应

随着AI助手逐渐取代传统搜索引擎成为新闻获取入口,这一问题的影响正在放大。根据路透新闻研究所发布的《2025年数字新闻报告》,约7%的线上新闻用户会使用AI助手获取新闻,而在25岁以下人群中,这一比例高达15%。

BBC同步进行的信任度调查揭示了更深层的危机:35%的英国成年人完全信任AI生成的新闻摘要,在35岁以下人群中,这一比例接近一半。更严重的是,42%的受访者表示,如果AI摘要出错,他们会连带对原新闻源失去信任。这意味着AI的错误不仅损害自身可信度,还会"拖累"BBC、路透社等权威媒体机构的声誉。

与此同时,《金融时报》发现来自搜索引擎的流量下降了25%至30%,部分原因正是"AI直接回答"分流了原始点击。AI在重构信息获取方式的同时,也在重塑信任坍塌的路径,形成了一个危险的负面循环。

技术局限与监管挑战

面对质疑,各大AI公司给出了不同回应。谷歌表示欢迎用户反馈以改进Gemini的实用性,OpenAI与微软承认"幻觉"现象是当前努力解决的技术挑战,Perplexity则声称其"Deep Research"模式的事实准确率可达93.9%。然而,这些回应难以掩盖技术本身的根本局限。

EBU媒体总监Jean Philip De Tender指出,这些失职并非孤立事件,而是具有系统性、跨境性和多语言性的问题,可能侵蚀公众信任。"当人们不知道该信任什么时,他们最终会变得什么都不信任,这会阻碍民主参与。"

研究报告呼吁采取多层面应对措施:AI公司应对其助手的新闻回应承担更高的透明度与责任,定期公开各语言版本的准确率数据;媒体机构需获得内容使用与溯源权,建立标准化引用格式;监管层应介入,防止"AI答案"完全取代"新闻过程";同时,公众教育也刻不容缓,让人们认识到AI的权威语气并不等于真相。

BBC生成式人工智能节目总监Peter Archer表示愿意与AI公司合作推进问题改进:"人们必须能够信任他们所读、所看和所见的内容。尽管取得了一些进步,但这些助手显然仍然存在重大问题。"

这项研究揭示的问题远超技术层面,触及了信息时代的核心矛盾:当算法开始包装真相,当权威性与准确性脱钩,整个社会的信息基础设施都面临前所未有的挑战。在AI技术快速发展的背景下,如何确保信息的真实性和可验证性,已成为关乎民主社会健康发展的关键议题。

各大新闻媒体和搜索引擎的下一步转型,不再是与AI竞争内容产出,而是要守住最后的验证体系。当45%的AI答案存在错误时,"信任"正成为人类信息系统中最稀缺的资源。这场关于真相与算法的博弈,将决定未来信息社会的走向。

来源:人工智能学家

相关推荐