联手华为开王炸!科大讯飞首个全国产算力深度推理大模型来了

B站影视 2025-01-16 13:37 2

摘要:2025年,被业界认为是大模型推理爆发年。大模型厂商们在开年便祭出“王炸”,1月15日,科大讯飞发布全国产算力平台上的深度推理大模型——讯飞星火X1,尚属业界首个。该模型中文数学能力国内第一,已率先落地教育、医疗等刚需场景。

IT时报记者 孙妍

2025年,被业界认为是大模型推理爆发年。大模型厂商们在开年便祭出“王炸”,1月15日,科大讯飞发布全国产算力平台上的深度推理大模型——讯飞星火X1,尚属业界首个。该模型中文数学能力国内第一,已率先落地教育、医疗等刚需场景。

全面对标OpenAI最新版GPT-4o的讯飞星火4.0 Turbo底座能力再次升级,首发混域知识搜索技术。作为2024年中标数量和中标金额“双第一”的大模型,在一定程度上,讯飞星火的研发方向揭示了行业和企业的大模型落地痛点。

而讯飞的看家本领是翻译,此次科大讯飞还推出业界首个具备端到端语音导语音同传能力的大模型——星火语音同传大模型,最快语音同传时延小于5秒,这意味着大模型在向翻译领域最高难度挑战时迈出了一大步。

首个全国产算力深度推理大模型

科大讯飞一直走全国产化路线,与华为深度合作,2023年10月24日,双方联合发布首个国产万卡算力集群“飞星一号”。2024年10月24日,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。

此前科大讯飞与华为组成“特攻队”,持续攻坚很多大模型在全国产算力平台上的训练推理挑战。最近,双方成功攻克训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终训练出我国首个基于全国产算力训练的具备深度思考和推理能力的大模型——讯飞星火X1。

这给2025年推理年的爆发踩了加速油门,但深度推理大模型跟通用大模型有何不同?从科大讯飞展示来看,讯飞星火X1在解答高考题、AIME竞赛题以及高中奥赛题的表现较为突出,不仅准确给出了题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。

通用大模型能力虽强,但是所耗费的算力成本过高,在某些领域,深度推理大模型能用更少的算力取得同等的效果。讯飞星火X1在近期参加的小初高(含竞赛)、大学(含竞赛)、AIME、MATH 500等多项“考试”中成绩十分亮眼,用更少的算力,拿下了多项指标国内第一。

2025年,大模型的发展定会反复强调,应用才是硬道理。

目前,讯飞星火X1率先在教育等真实场景落地应用。2024年10月24日,科大讯飞联合中国教育科学研究院发布了基于“问题链”的高中数学智能教师助手。同时也正面向全国百个试点区域、联合千名优秀教研员和老师打造上万个优秀案例。目前,星火X1已经部署上述试点区域,体验过的老师们表示,X1在一题多解、教学知识关联、拓展学生高阶思维等方面表现出色。讯飞星火X1也将成为学生和家长的帮手,后续融入科大讯飞AI学习机,让学习推荐和诊断将变得更加精准,解题思路和知识链条将更加清晰。

讯飞星火X1也在医疗领域取得初步验证,可使专科辅助诊断和复杂病历内涵质控的准确率均达90%,预计在2025年上半年正式发布基于讯飞星火X1的医疗大模型升级版。

最懂行业的大模型

对于讯飞星火来说,“最懂行业的大模型”这个称号是当之无愧的。根据第三方数据,2024年,讯飞星火在大模型中标数量和中标金额上取得“双第一”,尤其是在能源、金融、汽车、运营商等行业,与企业共同打磨了近百个智能体应用。

为了保持正向循环,科大讯飞在2025年开年便宣布,金融、油气、能源、电力、钢铁、航司等行业综合能力的提升全部超过10%。

这得益于讯飞星火4.0 Turbo底座能力的再次升级,全面对标OpenAI最新版GPT-4o,升级七大核心能力。

其中数学能力一直是讯飞星火的强项,基于讯飞星火X1的高质量合成数据,如今讯飞星火4.0 Turbo的数学能力变得更强,特别是在数学教学、金融分析和科研推演等方面。

图文识别能力直接关乎着企业能否高效的采编和利用行业、私域数据,是大模型“学习”的基础,涉及医疗的体检报告、法院的文书、学术论文、企业合同等,还有复杂长表格、杂乱板式、手写公式、印章手写合同、倾斜少线等情况。讯飞星火4.0 Turbo在通用文档版面分析、文字识别的准确率上提升40%,复杂表格结构、潦草手写文字等方面的准确率相对提升60%,可以大幅提升高价值数据的获取能力。对比测试表明,讯飞星火4.0 Turbo的图文识别能力领先国内外顶尖竞品。

一份500页的项目文件,从扫描、识别到解析的全过程,借助讯飞星火仅需2分钟即可全部完成,这也得益于讯飞星火提升了文档要素检测能力。

在企业知识问答这类严谨的应用场景中,用户对大模型幻觉的容忍度几乎为零。因此,讯飞星火推出了基于智能体的全新长文本框架,并行业首发了句子级溯源功能。这一新框架优化了超长注意力机制,同时利用大规模网页和书籍数据进行知识关联式合成,使得知识回复的错误率降低40%,句子级溯源效果更是超越了GPT-4o。

你如何用大模型为工作提效?绝大多数人的回答是搜索资料,特别是在写报告、做调研时,可以减少大量搜索信息、整理资料的时间。此次讯飞星火除了七大核心能力升级外,还在行业内首发混域知识搜索技术,该技术能够实现对个人知识、企业知识、业务系统数据、精品行业数据以及互联网信息的综合搜索,用户只需一次提问,即可获得综合搜索后的结果,大大提升信息搜索效率。

大模型摘下“翻译皇冠上的明珠”

什么是“翻译皇冠上的明珠”?同传翻译当之无愧。如今,科大讯飞已经摘下这颗“翻译皇冠上的明珠”。作为国内智能翻译领域的佼佼者,科大讯飞又完成一大突破,发布国内首个具备端到端语音同传能力的大模型——星火语音同传大模型。

而且科大讯飞翻译机、录音笔、办公本等硬件产品都会逐步搭载星火语音同传大模型。无论是在海外旅游,还是在国际展会上介绍专业产品,翻译机都能在短时间内完成中英双向同传任务。

科大讯飞还透露,针对语音到语音的同传场景,讯飞翻译机将会配置耳机、音箱、麦克风,在2025年推出商务套装,以便用户在不同的商务洽谈场景使用。

除了端到端的语音同传能力,星火语音同传大模型还促进了语音到文字翻译效果的提升,在日常对话、单人演讲、影视节目,包括场景更复杂、翻译难度更高的多人会议等场景以及医疗等专业领域,可以为各种国际交流场景提供实时翻译服务。

星火语音同传大模型可以最快实现仅5秒的同传时延,这是人类专家译员的水平。而且技术测试结果显示,即便将讯飞的语音同传技术和国外最优竞品的交传技术对比,讯飞语音同传在内容完整度、信息准确度以及语言质量上都处于领先水平,众所周知,同传比交传技术更难。

星火语音同传大模型通过模仿人类同传译员的思维链路进行训练,具备实时意群理解和切分、上下文语境精准选词以及碎片化信息重组的能力,这一特性使得星火语音同传大模型在处理复杂句式和语境时表现出色,能够迅速准确地传达原意。

科大讯飞的这一突破将掀起AI翻译行业的又一波巨浪。

来源:IT时报

相关推荐