摘要:随着人工智能技术的突飞猛进,生成式人工智能大模型已经成为引领媒体行业创新发展的关键引擎。特别是自2022年11月GPT—3.5问世以来,全球技术领域的迅猛发展与国内“百模大战”的激烈竞争,标志着生成式AI技术的连续突破,这些技术进步为媒体内容的创作与传播带来了
作者:肖勇
随着人工智能技术的突飞猛进,生成式人工智能大模型已经成为引领媒体行业创新发展的关键引擎。特别是自2022年11月GPT—3.5问世以来,全球技术领域的迅猛发展与国内“百模大战”的激烈竞争,标志着生成式AI技术的连续突破,这些技术进步为媒体内容的创作与传播带来了根本性变革。
大模型的兴起与媒体变革
2022年11月30日,OpenAI公司发布名为GPT—3.5的聊天大模型,其在对话生成方面能够准确理解上下文,并生成高质量、连贯、合理的回复,为用户带来流畅、自然的交流体验。同时,GPT—3.5还有广泛的应用场景,包括文本、诗歌、视频脚本、代码等多种形式的内容创作,甚至可以学习模仿特定的风格。因此,GPT—3.5发布后迅速吸引大量用户,成为全球用户增长最快的消费级应用程序。此后半年之内,OpenAI又先后发布GPT-4和GPT-4o,引入“多模态”特性,不仅能够处理图像信息,还具备实时推理音频、视频和文本内容的能力,进一步提升了大模型的应用广度,使人机交互更加自然流畅。
在国内,大模型发展同样迅猛。2023年3月16日,百度发布“文心一言”,开启了国内大模型的竞争。华为、腾讯等科技巨头,百川智能等初创企业,以及智谱AI研究院等研究机构纷纷投身大模型开发,轰轰烈烈的“百模大战”由此开启。据不完全统计,截至2024年4月底,国内共推出约305个大模型,共有约140个大模型完成生成式人工智能服务备案。
大模型正在深刻地改变着各行各业,对媒体行业同样产生了深远影响。国内媒体在大模型推进方面进行了积极探索。新华社于2023年5月初步研发完成名为MediaGPT的大语言模型,该模型专注于解决中国媒体实际需求,能够在媒体数据上进行训练。2023年7月20日,中央广播电视总台联合上海人工智能实验室发布“央视听媒体大模型”,以海量视听数据和深度专业知识为驱动,利用原创先进算法和超大规模算力进行训练,赋能视听节目创作、智能剪辑等多方面。解放日报社利用上海人工智能实验室开源的“书生·浦语”大模型2.0版及全链条开源工具体系,研制了一款从热点事件感知到新闻报道内容自动生成的AIGC(人工智能生成内容)应用系统。
每日经济新闻对大模型的思考
作为中国主流财经媒体,每日经济新闻(以下简称“每经”)早在2019年10月就前瞻性地意识到人工智能的发展前景,启动了AI战略,在既无资金补贴也无技术优势的情况下不断寻求适合传统媒体的转型模式。
每经在2020年开发出全覆盖A股上市公司的“AI快讯系统”,2021年12 月上线全球首个7×24小时不间断播放的“每经AI 电视”, 2022年7月自主研发“雨燕智宣”——AI短视频自动生成平台及“智能媒资库”,始终坚持“AI化+视频化”核心战略不变。
在生成式人工智能大模型深刻重塑媒体行业格局的浪潮中,每经自2023年初便启动了系列深入研究。经过多轮讨论,内部逐渐形成了共识:尽管生成式AI显著地改变了媒体生态,但并非所有媒体机构都必须自行研发或构建大模型。
自主开发大模型意味着要面对两大挑战。首先是高额的开发成本和技术壁垒。培育、训练和维护一个先进的大模型不仅需要巨额资金投入,还涉及庞大的数据收集、计算资源和专业人才团队。对于大多数媒体单位,特别是传统媒体机构来说,独立承担这些成本和技术挑战是不切实际的。其次,大模型的迭代速度异常迅猛。自2023年3月GPT-4发布以来,国内大模型层出不穷,特别是进入2024年后,随着技术的飞速发展,国内在特定细分市场上已诞生了多款备受瞩目的产品,例如Kimi的长文本总结能力以及通义千问在视频和音频转文本方面的卓越表现,与国际先进水平已经不相上下。
因此,对于包括每经在内的传统媒体而言,相较于自行开发大模型,更明智的选择是有效利用现有的国内大模型资源。特别是将国内大模型作为底层技术,专注于媒体自身的应用场景,探索更多具有针对性的细分小切口应用,这或许是传统媒体与大模型融合的最佳途径。
机制创新与员工转型
自2023年上半年起,每经在内部开启了对大模型应用的深入探索与尝试,鼓励员工在采编、行政、经营等日常工作中积极探索并研究国内领先的大模型技术。
1.定期分享机制。设立每周五的大模型分享会,邀请来自不同部门的记者、编辑及员工代表,基于各自工作领域的实际需求,展示如何有效利用大模型以提升工作效率并拓展工作的可能性。
2.创新激励计划。要求各部门每周提交关于大模型研究与应用的周报,优秀案例将被推荐参与公司每月的优秀应用案例评选,其奖励标准与月度新闻奖等同。
通过这些持续且深入的措施,每经成功培养了30余位优秀的Prompt工程师(提示词工程师)。这些工程师在视频、地产、金融、券商等专业频道的细分新闻报道场景中,能够熟练运用大模型技术辅助内容创作,提高工作效率,简化工作流程,并有效拓宽了报道的范围。
此外,一些原本非采编岗位的员工凭借对大模型技术的熟练掌握,迅速成长为优秀的Prompt工程师和大模型探索的先锋,进而参与到采编工作中,实现了个人职业生涯的飞跃。
大模型在媒体端的应用场景
经过近两年的深入探索与实践,每经总结出大模型技术在媒体行业的应用场景,集中在以下几个方面。
1.辅助撰写新闻稿件。早期AI新闻写作是利用预设模板生成具有固定结构的新闻内容。这种方法虽然提高了新闻发布的效率,但内容的多样性和深度受到了限制。而大模型拥有更强大的语言理解和生成能力,能够处理更复杂的文本生成任务。例如,能够根据给出的数据和上下文信息生成具有一定分析和见解的财经新闻报道,可以根据金融市场实时数据自动撰写具有一定数学逻辑的公司动态、市场动态等财经新闻。大模型还可以通过持续学习用户的反馈和最新的财务数据,不断优化其写作策略和内容质量。可见,大模型不仅提高了新闻撰写的速度和效率,还极大扩展了新闻内容的深度和广度。
2.提取新闻摘要。大模型能够快速识别并提取长篇文章或研究报告中的关键段落,捕捉核心观点和重要数据,从而生成精练的摘要。在提取关键内容的基础上,大模型还可以进一步分析文本的多个维度,包括主题、情感倾向、作者立场等,以确保摘要的全面性和准确性。对于不同理解水平的读者,大模型能够调整摘要的风格和深度,满足不同场景下的阅读需求。
3.智能编辑助手。大模型可以学习优秀稿件的范式,然后帮助编辑对稿件内容进行优化,提升文章的可读性。大模型可以通过学习第三方平台调性,自动生成多个标题选项,提高稿件的阅读量。大模型可以把新闻内容自动翻译成多种语言,同时根据不同地区的文化背景和语言习惯优化翻译内容,使其符合当地读者的阅读习惯。大模型还可以学习校对规则,通过多种技术手段对新闻内容进行审核,比如自动检测错别字并纠正语法错误、通过内部数据库和在线资源验证新闻事实,等等。
4.创作视频脚本。大模型可以分析和学习大量过往视频脚本素材,理解不同类型视频的叙事结构、语言风格和情感表达。基于深度学习和输入的素材,大模型能够快速、创造性地构思新的脚本内容,提供独特的故事情节和角色对话,为视频编辑提供初步的创作蓝图,节省了编辑记者从零开始构思的时间。
5.创作视频动画。2024年2月,OpenAI旗下Sora文生视频大模型的发布,标志着生成式AI在视频内容生成领域迈出了重要一步。文生视频大模型能够将文本描述转化为动态图像,这使得从书面概念到视觉表现的转换变得更加直接和高效。在新闻领域,文生视频大模型能够根据对新闻事件的描述自动生成动画,重现事件场景;也可以生成简短的解释视频,通过动画和图像的结合简化复杂概念的解释,降低受众对专业新闻和复杂新闻事件的理解门槛。在短视频作为新闻重要载体的今天,文生视频大模型可以快速响应新闻事件,及时提供视觉内容,大幅提升了视频内容的生成效率和门槛。
6.智能化运营。智能化运营是大模型在媒体行业应用中的一个重要方面。比如,大模型可学习优秀新闻稿件的判定规则,给每条稿件打分,然后根据新闻的重要性、分数的高低自动推送到网站、客户端等平台的相应位置,并判定是否重点推荐等,实现内容运营的全流程数字化。同时,大模型能够分析各平台的热门话题和用户互动模式,生成风格各异的帖子,通过提高帖子的吸引力和参与度确保新闻内容在各平台都能吸引目标受众。而以大模型为底座构建的聊天机器人则能全天候及时响应用户需求,提供即时的新闻解读和背景信息。
7.辅助深度报道。在记者进行深度调查方面,大模型可以发挥多方面的辅助作用。首先是新闻线索的监控。大模型能够实时监控、收集、处理和分析来自不同渠道的大规模数据集,包括社交媒体、新闻网站、论坛和博客等,帮助记者实时监控新闻。同时,大模型可以分析大量帖子、文档、报告等碎片化信息,提取核心、关键内容和模式,帮助记者找到隐藏的关联逻辑和重要的细节。其次是专业深度信息的查找。利用大模型赋能的搜索引擎或者通过专业知识库、专家库建立的数据集,记者在进行专业新闻调查时可以更高效地查询专业知识。再次是辅助调查。大模型可以对收集到的大量信息以及记者调查到的新闻事实进行自动分类和整理,生成有结构的摘要和报告,梳理出多个新闻事实之间可能存在的关联和因果关系,为深度调查报道提供参考。同时,大模型可以根据事件发生的时间顺序生成详细的时间轴,帮助记者梳理事件的发展脉络,找出关键时点和变化趋势。
自主研发“雨燕智宣——AI创作+”
随着内部各职能部门在特定应用场景的持续深耕以及一批批优秀的Prompt工程师的涌现,每经将不同部门约30位人才汇集到一起,组成了“大模型攻坚组”。大模型攻坚组由资深记者、编辑、技术工程师以及数据分析师组成,他们不仅精通传统媒体的采编工作,还对新兴的AI技术有着深刻的理解和实践能力,并在Prompt对话技术方面展现出卓越的专业技能。
围绕前述大模型在媒体行业的多个应用场景,大模型攻坚组与子公司每经科技携手合作,构建了一个先进的大模型测试平台。该平台通过API接口集成了市场上所有主流的大模型,并在统一的应用场景下对这些模型的输出结果进行了细致的比较、深入的分析和严格的评测。经过这一过程,评测小组筛选出在特定细分领域表现最为出色、评分最高的大模型,并将其封装为一款自主研发的创新产品“雨燕智宣——AI创作+”。
“雨燕智宣——AI创作+”的推出,极大简化了内部记者、编辑以及外部用户使用大模型的操作流程。用户仅需提供必要的素材,即可一键获得在特定场景下生成的内容。这一创新不仅解开了用户在面对市场上多个大模型时如何选择的困惑,也省去了撰写复杂Prompt的繁琐,实现了全流程的极简化操作。
目前,“雨燕智宣——AI创作+”已在内容创作、智能运营、智能采编等多个应用场景中成功部署了约20项任务,涵盖视频脚本创作、文本纠错、文案润色、创意标题生成、采访提纲制定、新闻快评撰写、优秀作品评选、同题比较分析等。此外,“AI创作+”已面向市场销售,实现了商业化落地,获得业界的广泛认可和高度评价。
结语
目前,每日经济新闻正积极与工信部AI应用工作组等外部机构展开合作。该合作旨在充分发挥每经作为财经媒体的专业属性以及优秀记者、编辑团队深厚的采编经验,再结合每经30余位优秀Prompt工程师以及大模型测试平台,对市场上众多主流大模型在文本生成、内容创作、视频制作等关键应用领域的性能进行全面评测。评测结果将以定期发布的评测报告和排名榜单的形式呈现,旨在为业界提供权威、客观的参考依据。
我们相信,通过这一举措,不仅有助于推动大模型技术的广泛应用,而且通过持续发布专业的评测报告和排行榜,将进一步促进包括媒体在内的社会各行各业的数字化转型进程。
(作者肖勇为每日经济新闻编委)
本文刊于《全媒体探索》2024年11月号,原标题为《大模型在财经媒体的应用与实践》。
来源:大众日报一点号