摘要:语言服务是应用多语言能力和信息技术能力满足社会、家庭或个人等多种类型主体的语言需求而提供的各种同语言相关的服务,具有显著的经济价值和社会价值。近年来,人工智能加速更新迭代,对人们的生产、生活、学习方式带来深刻影响。作为当前人工智能的一项关键技术,大语言模型利用
语言服务是应用多语言能力和信息技术能力满足社会、家庭或个人等多种类型主体的语言需求而提供的各种同语言相关的服务,具有显著的经济价值和社会价值。近年来,人工智能加速更新迭代,对人们的生产、生活、学习方式带来深刻影响。作为当前人工智能的一项关键技术,大语言模型利用深度学习和神经网络对海量数据进行训练,形成了强大的文本生成、语言理解与逻辑推理能力,正逐步渗入语言服务的全过程。
大语言模型拥有规模庞大的参数、复杂的神经网络结构以及先进的预训练策略。从技术层面看,大语言模型是一种统计和概率框架,是自然语言处理的一种技术类型,主要采用Transformer框架,如GPT、BERT等。大语言模型模拟了人脑的神经网络,其底层转换器是由一组具有自注意力功能的编码器和解码器组成的神经网络,它赋予了大语言模型能够模拟人类大脑理解单词和短语之间关系的能力。从运行逻辑上看,大语言模型主要包括预训练和微调两个阶段。在预训练阶段,大语言模型需要根据语意、语法、句法等语言规则学习大量的、复杂的文本,以便让模型能够学习到语言结构和语义信息的通用特征,掌握语言表示的普遍规律。完成预训练后,转换器会使用多维向量对预处理的自然语言文本进行数学表达和识别,并使具有相似含义或相关性的单词在向量空间上接近,从而更好地实现对信息的准确理解和内容的精准生成。在微调阶段,大语言模型将大型数据集上预训练的模型应用到一个更小、针对特定任务的数据集上展开进一步训练,以使得这些模型能够更加灵活适应多种应用场景。可以说,微调不仅具有强化大语言模型在特定任务上的能力,提高模型性能的技术优势,还具备降低成本的经济价值。在数字化和智能化快速发展的背景下,大语言模型将引发语言服务的技术基础、服务模式和产业形态等一系列新变革和新发展。
一是大语言模型为语言服务提供新的技术支持。在传统的语言服务场景中,语言服务工作者往往依赖人工经验来解决某些代理任务。因受个体能力差异的影响,语言服务的效率和质量往往难以得到保障。大语言模型技术的发展和应用,催生了越来越多支撑语言服务发展的技术工具。比如,一些基于大语言模型的聊天机器人程序,可以通过角色扮演模拟人类互动来高效完成语言服务工作流程。在大语言模型技术赋能的人机协同语言服务工作模式中,机器与人的协同互补作用能够进一步提升语言服务的质量。就语言翻译服务领域而言,口笔译服务逐渐转向人机交互口译或“机器翻译+译后编辑”的工作模式。同时,由大语言模型带来的智能工具,可以对语言服务工作者原有的服务技能进行辅助增强。比如,语音识别和语音合成技术支持自动转录和生成语音,实现了对人类译者翻译技能的辅助增强,提高了语言翻译的效率和准确性。值得一提的是,嵌入大语言模型的人形机器人通过自然语言的处理、机器学习和深度学习后,逐渐具备类似人的判断、推理、交互等能力,能够实现与人的自动化连接,为人们摆脱高重复、低创意的语言服务工作,从事具有创造性、挑战性的语言服务活动提供更多空间和机会。
二是大语言模型为语言服务带来新的服务模式。借助大语言模型使语言服务走向专业化、精细化、特色化和新颖化,是推动语言服务高质量发展的内在要求。大语言模型推动语言服务走向“专、精、特、新”主要体现在升级现有业务、拓展新型业务两个方面。在升级现有业务方面,大语言模型可以使语言服务由人工语言服务模式转变为“人工+大语言模型”混合语言服务模式,也可以使语言服务企业向依靠数据驱动和知识驱动的运营模式转变,有利于企业专注于特定领域和特定应用,从而为语言客户提供多地区、个性化、专业化的语言服务。在新业务的拓展方面,大语言模型使语言服务企业除了提供常规意义上的机器翻译、语言处理、本地化工程等服务外,还可以为客户提供定制化的语音转录、多模态翻译、大数据舆情监测、企业社会责任宣传等服务内容,极大地拓展了语言服务行业的服务范围和深度。
三是大语言模型使语言服务形成新的产业形态。大语言模型作为人工智能的关键性技术,其深度学习、语言生成和交互能力推动语言服务从传统的个人或小作坊式转向专业化、团队化、流程化的管理方式发展。根据《中国语言服务市场发展报告》(2024)统计,截至2023年底,我国机器翻译与智能语言服务市场总值达616.9649亿元,各类智能语言服务从业者数量和岗位需求量再创新高。从语言服务的技术来看,大语言模型与语音交互技术深度融合,为客户提供更加智能的语言交互体验。在语言服务的智能化硬件和软件开发上,大语言模型技术的使用衍生出新的服务载体,不仅包括智能终端、插件等硬件,还包括面向开发者二次集成的应用程序接口和软件开发工具包。这些硬件、软件技术结合图像、视频等多模态信息,进一步拓宽了语言服务的应用场景,催生了新的产业形态,如机器翻译、智慧教学、医疗保健、文化创意等。对于语言服务而言,大语言模型技术改进了服务质量、降低了服务成本、提升了服务效率,其规模化的产业效应也凸显了它在语言服务中的商业价值。
大语言模型技术在语言服务各个领域中展现出巨大的应用潜力和商业价值,但这项技术的应用也面临着较为复杂和严峻的现实挑战,主要表现为技术研发不足、法律法规滞后以及人才和资源相对紧缺等问题,掣肘着大语言模型对语言服务赋能作用的发挥。面对这些问题,要更加安全、可靠、高效地发挥大语言模型在语言服务行业中的重要引擎作用,可以从以下方面着力。
一是推动大语言模型的理论和技术研究,为语言服务发展提供动力支撑。当前,大语言模型已展现出巨大的科技潜力和经济价值。对此,要加快培育具有全球竞争力的大语言模型创新生态,鼓励企业、高校和科研机构等主体发挥各自的创新优势,加强大语言模型基础理论和关键共性技术研发,夯实大语言模型的数据基础,特别是在智能芯片、云平台、数据等基础技术上要实现创新突破。此外,大语言模型的可解释性和透明度成为评估语言服务安全、可靠与否的关键因素。因此,采用可解释性算法等技术手段成为必要,这不仅能提升大语言模型自身的性能,还能够增强人们对语言服务质量的信赖。
二是完善大语言模型应用的产业体系,形成语言服务发展集群优势。以语言服务的发展需求为导向,利用大语言模型赋能传统产业转型升级,支撑战略性新兴产业和未来产业的发展。在发展策略上,要进一步丰富大语言模型在语言服务行业的应用场景,大力发展嵌入大语言模型的语言服务新技术、新产品和新业态,形成大语言模型与产业应用良性互动的新发展格局。同时,可以集结一批集算力、算法、产品、人才、资金、技术等要素的专精特新企业,构筑优势互补、互利共赢、利益共享的产业集群,致力于打造世界级的大语言模型产业链供应链协同发展新格局,为大语言模型赋能语言服务全周期科创服务。
三是优化大语言模型赋能的政策环境,激发语言服务发展要素活力。大语言模型重构下的语言服务价值链已然形成,并将引领语言服务行业发展的未来趋势。对此,应做好行业发展的顶层设计。一方面,要推进涵盖算法、数据、深度合成等领域的人工智能大语言模型的立法工作,为大语言模型赋能语言服务营造良好的法律氛围。另一方面,要发挥好有为政府和有效市场的作用,在尊重大语言模型技术自身发展规律的前提下,引导制定语言服务发展的利好政策。此外,要加强与高校、企业、科研机构的合作,推动高水平语言服务人才培养,促进产学研商一体化格局的形成。
本文来自【中国社会科学网】,仅代表作者观点。全国党媒信息公共平台提供信息发布及传播服务。
来源:人民日报党媒平台