OpenAI被反超?谷歌新模型错误率暴降70%,教授惊呼:已达专家水平

B站影视 电影资讯 2025-11-18 10:21 1

摘要:AI 圈要变天了!谷歌即将登场的 Gemini 3.0 模型凭一组实测数据炸翻全网,手写文稿识别错误率直接砍半还多,连历史学教授都忍不住为其能力惊叹。

AI 圈要变天了!谷歌即将登场的 Gemini 3.0 模型凭一组实测数据炸翻全网,手写文稿识别错误率直接砍半还多,连历史学教授都忍不住为其能力惊叹。

更让人期待的是:预测市场近九成参与者押注它本周发布,谷歌 CEO 的微妙回应更是让这场 AI 界的 "巅峰对决" 提前升温。

Gemini 3.0 的发布预热堪称谷歌史上最 "高调" 的一次,全球最大预测市场 Polymarket 数据显示,79% 的参与者精准下注 11 月 18 日为发布日。

而谷歌 CEO 桑达尔・皮查伊上周末直接转发了这一预测数据,配上两个若有所思的表情,相当于变相确认了时间表。

这种公开回应猜测的操作,和谷歌以往低调发布技术产品的风格大相径庭,不仅管理层释放信号,谷歌员工也集体 "剧透"。

不少员工在社交媒体主动分享对新模型的期待,这种自发的兴奋情绪在之前的模型发布前从未有过。

更有提前接触过模型的内部人士向 Business Insider 透露,Gemini 3.0 的表现 "极其惊艳",尤其是在编码和多媒体生成领域的进步让人意外。

专业测试中的表现让这款模型的实力有了实打实的支撑,加拿大劳瑞尔大学历史学教授 Mark Humphries,用自己研究中常用的 18 世纪手写会计账簿做了测试。

这些文稿不仅字迹潦草,还涉及当时特有的词汇、计量系统和拼写规则,对识别工具的要求远超普通文本。

测试结果显示:前代 Gemini 2.5 Pro 的字符错误率约为 4%,和专业人类转录员水平相当。而疑似 Gemini 3.0 的未发布版本,字符错误率仅 0.56%,词错误率 1.22%,相比前代提升 50%-70%,直接达到专家级水平。

而且模型能把账本中 "145" 自动推断为 "14 磅 5 盎司",精准匹配当时的计量习惯。

除了历史文本识别,新模型在实际应用场景中也展现出硬实力,有 AI 爱好者发现,使用移动版 Gemini 应用的 "画布" 视图时,调用的 Gemini 2.5 Pro 背后疑似是偷偷上线的 Gemini 3.0。

有开发者用它一键生成了美观且功能完整的网页,甚至成功克隆出简化版 Windows 操作系统和 Youtube 网站界面,编写的可交互 SVG 动画也能直接运行。

还有用户尝试让模型创作原创音乐,生成的作品旋律流畅,完全达到可听级水准。

谷歌旗下的热门图像工具 NanoBanana 也将借 Gemini 3.0 实现升级。这个名字源于员工临时创建的占位符,因在 AI 评估平台 LM Arena 测试中意外走红而被正式采用。

随着新模型发布,这款已获用户好评的工具将迎来功能强化,进一步补齐谷歌在多媒体生成领域的竞争力。

从市场格局来看Gemini 3.0 的发布对谷歌意义重大。2022 年底 ChatGPT 推出后,谷歌曾陷入 "红色警报" 状态,在 AI 竞赛中一度处于追赶位置。

而 OpenAI 今年发布的 ChatGPT-5 被指 "噱头大于实际",未能带来突破性影响,这也给了谷歌反超的机会。

谷歌三季报显示:Gemini 系列全球月活用户已达 6.5 亿,较二季度的 4.5 亿大幅增长,距离 ChatGPT 的 8 亿周活用户差距正在快速缩小。

加上谷歌拥有自身的分发渠道和全球第三大云业务 Google Cloud 提供的算力支持,其可持续性优势明显。

Gemini 3.0 的出现不仅是谷歌 AI 战略的转折点,更可能推动整个行业的变革。如果它的推理能力得到系统验证,AI 将有望从单纯的信息处理工具,升级为具备真正理解能力的系统。

对普通用户来说更强大的编码、多媒体生成功能将降低创作门槛,对专业领域而言,历史学家能快速数字化分析百年文献,复杂认知任务的自动化将成为现实。

AI 领域的竞争从来都是推动技术进步的动力,Gemini 3.0 的即将登场让这场较量更加精彩。

无论最终能否实现市场地位的反转,这种技术突破都将为用户带来实实在在的便利,也让我们对人工智能的未来有了更多期待。

来源:聆听娱纪一点号

相关推荐