网易有道突破翻译大模型,14B小参数垂类模型全量上线应用|钛媒体独家

B站影视 电影资讯 2025-03-10 22:08 2

摘要:3月10日,钛媒体APP从网易有道独家获悉,有道翻译大模型已经实现底层技术迭代,基于自主研发的子曰翻译大模型2.0,其中,14B小参数垂类模型,实现了高水准的翻译性能,现在已经全量上线。

图片来自网易有道

3月10日,钛媒体APP从网易有道独家获悉,有道翻译大模型已经实现底层技术迭代,基于自主研发的子曰翻译大模型2.0,其中,14B小参数垂类模型,实现了高水准的翻译性能,现在已经全量上线。

14B小参数垂类模型推出,意味着在训练和推理时,AI翻译消耗的计算资源更少,部署的成本更低,更容易集成到现有系统和设备中,适合更多的实际场景。

钛媒体APP观察到,搭载全新大模型的翻译技术,已在有道词典、有道翻译及有道翻译官内上线,提供标准模型和高级模型两种不同参数的选择,用户可直接切换使用。

与此同时,该大模型已经上线网易有道旗下智能硬件产品,有道词典笔X7系列已升级为最新的翻译大模型,其余型号将陆续更新。

事实上,大语言模型的性能并非完全由参数量决定,很大程度上也依赖于数据质量、领域适配性与算法优化的结合。

钛媒体APP了解到,网易有道之所以能够实现14B小参数垂类模型,是因为,在数据层面,新的模型技术收集并清洗了高质量的翻译语料数据,并由英语专业八级认证人员及职业译员进行精细化人工标注,使得模型拥有海量的优质数据资源库,增强其在多样化翻译场景的应对能力。

而在算法层面,有道以子曰大模型为基础,进行了二次预训练,打造了兼具专业性与针对性的翻译基座大模型,结合大模型蒸馏技术、大模型融合技术和Online DPO(在线直接偏好优化)技术等手段,避免了大模型的灾难性遗忘等问题,并在运行效率、准确性、流畅性等翻译性能上实现大幅提升。

最后是在评估层面,借助翻译数据沉淀,有道研发了翻译评估模型Reward Model,为子曰翻译大模型的性能评估,提供一个可靠的量化依据,以及完善的人工评估方案,多维度对模型的翻译结果进行评估和分析。

垂类模型通过聚焦特定领域,在特定任务的优化上,具备相对优势。在垂直场景上,子曰翻译大模型2.0,在中英文互译领域有所突破,译文的专业度和稳定性较前代版本均有提升。

此外,根据有道内部测评,新的翻译模型在人文学科、商科、生活服务、医疗、科学等19个垂直领域的多学科的专业性、准确性、语言惯例和风格等方面,展现出了相比之前更高的翻译准确率和流畅度。

网易有道相关负责人对钛媒体APP表示,“通用大模型比的是参数大和算力强,但翻译靠参数堆不出专业度。当通用大模型竞逐参数规模时,我们更相信垂类模型的未来价值,用专业的垂直应用真正解决专业场景的痛点,也是我们持续努力的方向。”

大模型技术浪潮之前,有道翻译技术主要基于统计机器翻译及神经网络翻译技术(NMT)。

截至目前,有道全系翻译产品拥有超10亿用户。Quest Mobile数据显示,网易有道词典月活跃用户数已超过1亿,自2019年起,已连续六年位居教育类工具领域榜首。(本文独家首发于钛媒体APP,作者|李程程)

来源:钛媒体APP

相关推荐