摘要:科技飞速发展,AI深刻改变各行各业。近年来,国内外出版机构纷纷探索将AI大模型应用到出版各环节之中,以期提升生产力、优化工作流程并满足用户日益增长的知识服务需求。然而,在AI大模型带来无限可能的同时,也伴随着诸多挑战与思考。AI大模型在出版业的应用现状如何?潜
科技飞速发展,AI深刻改变各行各业。近年来,国内外出版机构纷纷探索将AI大模型应用到出版各环节之中,以期提升生产力、优化工作流程并满足用户日益增长的知识服务需求。然而,在AI大模型带来无限可能的同时,也伴随着诸多挑战与思考。AI大模型在出版业的应用现状如何?潜在挑战有哪些?未来发展趋势怎样?站在新一年的起点,《中国新闻出版广电报》记者以“三问”求教业内专家与从业人士。
国内外出版业应用如何
将AI大模型应用于出版业,国外出版机构已形成较为成熟的模式。
例如,爱思唯尔于2024年初推出基于生成式人工智能技术的科研助手Scopus AI,它以来自全球7000多家出版商的27800多种学术期刊内容等为基础,为科研人员提供研究主题摘要,以及自然语言查询和“思维导图演示”等功能。
施普林格·自然开发了Geppetto、SnappShot、AskAdis等多种AI工具,用于总结多个来源的研究;将这些总结扩展成整本图书;帮助期刊编辑寻找合适的审稿人;维护科研诚信等。
还有一些学术出版机构如圣智、泰勒弗朗西斯以及威立,选择将其书籍版权授予科技公司,用于训练聊天机器人等AI工具。哈珀柯林斯与微软达成协议,允许使用其出版的书籍训练大型语言模型。
“国外出版业大模型应用起步早、发展快,目前无论在资源层、生产层,还是营销服务层,都已形成较为先进的应用模式。”北京师范大学新闻传播学院教授秦艳华结合最新研究表示,国外学术出版商主要选择以自主开发的模式建设语料库,因为学术出版的内容资源更具创新性和垄断性,因而其使用价值更高。
她同时谈道,目前我国各机构和企业发布的大语言模型已超200个,出版业大模型呈现良好的研发和应用趋势。国内出版单位推动AI大模型在选题策划、内容创作、编辑校对、营销服务等多个出版环节投入应用,一定程度上提高了出版企业的生产力。
过去一年,这样的案例有不少。例如,武汉理工数字传播工程有限公司的BOOKSGPT大模型开发两大人工智能产品——AI选题策划编辑和AI选题情报员,用来有效赋能图书选题策划。蜜度科技股份有限公司研发的文修智能校对大模型提升书稿审校速度,一本600余页图文混排的PDF书稿,仅需二十几分钟即可完成校对。北京万物可知技术有限公司的“可知AI”平台目前聚集30余万种电子书,在快速提炼并生成核心内容的同时推广相关图书,提高了阅读率并有效促进电子书的采购转化。
中国新闻出版研究院2024年9月揭晓的“新闻出版业人工智能大模型创新应用案例征集”结果中,除前述案例之外,还有中华书局古联(北京)数字传媒科技有限公司的“荀子”古籍大语言模型、中信出版集团有限公司的“中信出版夸父AI平台”、外语教学与研究出版社的中华思想文化术语库AI小语、知网与华为联合建设的“华知大模型”等入选。
“根据服务目标不同,应用于出版业的AI大模型主要分为优化内部工作流程、提升效率的自有平台;面向C端用户完善现有知识服务功能;面向B端用户进行工具型AI 开发等类型。”中国新闻出版研究院工程研发中心(信息中心)副主任王扬表示,目前,出版产业数字化程度日渐提升,知识经济下人们知识需求日益增长,两者之间缺乏高效交互的桥梁,AI大模型对知识服务产品供需两端均有很好的助力。
热度背后有哪些冷思考
面对AI大模型的应用与发展,仍需保持清醒头脑和冷思考,在追逐技术热潮的同时,不可忽视其潜在挑战与长远影响。
首先,面对琳琅满目的通用大模型,打造出版业专业大模型是否有必要?
秦艳华对此表示肯定的同时,也提出打造出版业专业大模型的难点所在,包括多数出版单位工程化能力尚且不足,出版专业语料库建设仍显乏力,调用国外大模型涉及数据跨境的合规风险,对版权的界定不够清晰等。
“出版业专业大模型更有利于抓住行业痛点,实现出版融合创新。”为此,秦艳华提出,要通过构建精细化政策与法律体系,打造高精深出版语料库,规范大模型合作机制,提供跨模态营销方式,打造“智能体+”交互生态等方式,助力出版单位以大模型应用推动行业高质量发展。
其次,伴随AI大模型应用不断深入,出版单位自主研发大模型是否可行?
记者在采访中了解到,目前,国内出版单位多采用通用大模型接口调用或基于开源模型强化训练的方式开发大模型。
但记者也关注到,蜜度科技股份有限公司的文修智能校对大模型,成为行业为数不多的自研大模型之一。
在蜜度科技股份有限公司研发副总裁张晓娟看来,自研模型可以实现按需定制,能够更灵活、更及时地完善产品的服务能力和提升用户体验,满足个性化、精细化需求。
但是,出版单位自主研发大模型面临诸多挑战。如在专业人才和物力基础方面的投入较大,在平衡专业大模型和通用大模型方面要有所取舍。从计算成本考虑,如何将行业能力更好地压缩进模型以提高知识密度,而不是单纯扩大参数量,对团队的行业经验和专业技能都有很高的要求。
不可忽视的还有,在门槛较高,虽“小众”但重要的专业出版领域,AI大模型的应用与发展同样面临挑战。
我国古籍浩如烟海,AI应用于古籍数字化提升古籍整理效率的同时,同样面临难点。古联公司古籍实验室主任苏瑞欣表示,目前,AI处理古籍专业任务的准确率、可靠性、适用范围还不足以支撑大规模产业应用需求。
古联公司在AI大模型上的探索,或能为专业出版提供思路——加快技术转化,助力专业内容走出象牙塔的“高不可攀”,向大众所需知识的融合转化。
苏瑞欣认为,可以把已经较为成熟、相较于通用大模型更具优势的古文大模型转化为用户需求的一部分,在更全面满足专业用户需求的同时,提升古籍内容普及性、知识性应用。同时,要注重将已经完成的数智化技术转化为生产力工具,转化为面向出版产业及更大范围的产业应用产品,使其能真正满足古籍数字化、古籍整理出版的大规模产业应用需求。
如何培育出版新质生产力
既有机遇也有挑战,AI已然是一把双刃剑。岁末年初,梳理出版单位的新年献词,从中也可“窥见”出版单位对AI的审慎态度以及保持理性、善用优势,推动行业改革创新发展的信心与决心。
坚持“改变才是不变的选择”,联合出版(集团)有限公司提出在AI浪潮下,将围绕新技术新空间新场景创造文化新价值,加快推动“渠道变革、业态创新、科技驱动、管理升级”,实施品牌驱动、文化出海,推动融合发展、业态创新……
青岛出版集团董事长贾庆鹏在新年献词中写道,将落实好新发展理念,加快版权、技术和资本的流动,融合AI技术应用,塑造出版的新质生产力,培育新产品、新模式、新渠道,在改革中突破,在突破中前行。
“AI发展虽迅猛,人类精神无可替代。”南京师范大学出版社提出,在AI技术快速发展的当下,我们愈发坚信人类精神的力量。AI能够辅助我们进行内容的创作和编辑,但它无法取代人类的情感和创造力。
……
大模型掀起的浪潮加快了AI在各行各业的融入速度,出版业以加速度拥抱新技术,创新步伐从未停歇。
展望新的一年,张晓娟认为,大模型在出版业的应用有望带来新变化:一方面,面向出版业的多模态智能审校、多语言转换等能力的提升,能够为出版物的质量控制和海外拓展提供坚实的基础;另一方面,文生图、图生文以及视频生成等技术与出版领域的进一步融合,交互式阅读环境,AI辅助阅读等将为用户阅读体验的提升带来更多可能;此外,出版业的专业知识与经验对AI技术合理应用以及内容高质量产出也能够发挥重要作用。
在这波AI大模型浪潮中,出版业又该如何抓住发展机遇破浪前行?
王扬提出,出版单位应加紧数字资源入库,探索轻量化专业服务,促进资源价值转化;强化AI工具属性,防范内容风险。她同时提出要摆脱技术“内卷”焦虑。在产品形成稳定市场之前,出版单位可基于通用大模型加强现有应用的能力,提供增值服务,拓展营收渠道。
“出版单位首先要习惯大模型驱动的新质生产力所带来的工作流程、作业方式、多模态内容输出、内容交互、数据分析、个性化服务、消费方式等各方面的深刻变化,形成新的世界观和思维方式。”展望2025年,北京万物可知技术有限公司董事长兼总裁赵海涛表示,专业领域大模型将迎来发展,建议出版单位可重点关注数据确权和数据资产管理、数据赋能和版权运营、场景设计和产品服务、用户交互和隐私保护等方面存在的发展机遇。
来源:中国新闻出版广电报