LLM近一半回答在扭曲真相！ChatGPT、Gemini全部顶流模型统统中招

摘要：BBC与欧洲广播联盟最新研究揭露了人工智能新闻助手的严重问题——在对全球四大主流AI平台进行的大规模测试中，高达81%的回答存在不同程度的错误，其中45%包含重大失实信息。这项涵盖18个国家、14种语言、3000个新闻相关问题的综合评估，为AI技术在新闻领域的

BBC与欧洲广播联盟最新研究揭露了人工智能新闻助手的严重问题——在对全球四大主流AI平台进行的大规模测试中，高达81%的回答存在不同程度的错误，其中45%包含重大失实信息。这项涵盖18个国家、14种语言、3000个新闻相关问题的综合评估，为AI技术在新闻领域的应用敲响了警钟。

研究团队对ChatGPT、Copilot、Gemini和Perplexity四大AI助手进行系统性测试后发现，错误并非偶发现象，而是跨越语言、地区和平台的系统性问题。更令人担忧的是，这些AI助手的"拒答率"已从半年前的3%骤降至0.5%，意味着即使面对不确定信息，它们也倾向于给出看似权威但实际错误的答案。

虚假权威的危险游戏

此次研究由来自法国、德国、西班牙、乌克兰、英国和美国等18个国家的22家公共媒体机构共同参与，评估了AI助手在新闻准确性、信息来源可靠性以及区分事实与观点能力方面的表现。结果显示，这些AI系统最严重的问题集中在信息来源方面，近三分之一的回答存在来源错误，包括遗漏关键信息、提供误导性引用或完全错误的署名。

在具体表现上，谷歌的Gemini表现最为糟糕，72%的回答存在来源错误，总体错误率高达76%。更令人震惊的是，部分AI助手甚至伪造新闻链接或将讽刺节目作为事实来源引用。例如，当被问及"NASA宇航员为何被困太空"时，Gemini回答称这是"误解，可能把科幻电影当成新闻"，而事实上当时确实有两位宇航员因飞船故障滞留九个月。

准确性问题同样严重，约20%的回答包含过时或错误信息。ChatGPT在方济各去世数月后仍称他为"现任教皇"，Gemini误报英国"一次性电子烟法规修改"，Perplexity在报道捷克代孕法时甚至直接"立法造句"。这些错误不仅误导用户，更可能对政策理解和公共决策产生深远影响。

信任危机的连锁反应

随着AI助手逐渐取代传统搜索引擎成为新闻获取入口，这一问题的影响正在放大。根据路透新闻研究所发布的《2025年数字新闻报告》，约7%的线上新闻用户会使用AI助手获取新闻，而在25岁以下人群中，这一比例高达15%。

BBC同步进行的信任度调查揭示了更深层的危机：35%的英国成年人完全信任AI生成的新闻摘要，在35岁以下人群中，这一比例接近一半。更严重的是，42%的受访者表示，如果AI摘要出错，他们会连带对原新闻源失去信任。这意味着AI的错误不仅损害自身可信度，还会"拖累"BBC、路透社等权威媒体机构的声誉。

与此同时，《金融时报》发现来自搜索引擎的流量下降了25%至30%，部分原因正是"AI直接回答"分流了原始点击。AI在重构信息获取方式的同时，也在重塑信任坍塌的路径，形成了一个危险的负面循环。

技术局限与监管挑战

面对质疑，各大AI公司给出了不同回应。谷歌表示欢迎用户反馈以改进Gemini的实用性，OpenAI与微软承认"幻觉"现象是当前努力解决的技术挑战，Perplexity则声称其"Deep Research"模式的事实准确率可达93.9%。然而，这些回应难以掩盖技术本身的根本局限。

EBU媒体总监Jean Philip De Tender指出，这些失职并非孤立事件，而是具有系统性、跨境性和多语言性的问题，可能侵蚀公众信任。"当人们不知道该信任什么时，他们最终会变得什么都不信任，这会阻碍民主参与。"

研究报告呼吁采取多层面应对措施：AI公司应对其助手的新闻回应承担更高的透明度与责任，定期公开各语言版本的准确率数据；媒体机构需获得内容使用与溯源权，建立标准化引用格式；监管层应介入，防止"AI答案"完全取代"新闻过程"；同时，公众教育也刻不容缓，让人们认识到AI的权威语气并不等于真相。

BBC生成式人工智能节目总监Peter Archer表示愿意与AI公司合作推进问题改进："人们必须能够信任他们所读、所看和所见的内容。尽管取得了一些进步，但这些助手显然仍然存在重大问题。"

这项研究揭示的问题远超技术层面，触及了信息时代的核心矛盾：当算法开始包装真相，当权威性与准确性脱钩，整个社会的信息基础设施都面临前所未有的挑战。在AI技术快速发展的背景下，如何确保信息的真实性和可验证性，已成为关乎民主社会健康发展的关键议题。

各大新闻媒体和搜索引擎的下一步转型，不再是与AI竞争内容产出，而是要守住最后的验证体系。当45%的AI答案存在错误时，"信任"正成为人类信息系统中最稀缺的资源。这场关于真相与算法的博弈，将决定未来信息社会的走向。

来源：人工智能学家

标签：模型 gemini llm chatgpt bbc

本文地址：http://news.43b.com.cn/a/1659118.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!

相关推荐