用AI探索“数据传承”新范式,岭南文化大数据中心让文化“活”起来

B站影视 内地电影 2025-03-28 15:25 1

摘要:在数字音乐行业规模保持全国领先的广州,当地文旅部门联合趣丸科技“天谱乐AI”打造出极具“羊城风韵”的AI音乐作品;在创新之都深圳,虚拟数字人“厘里”与真人演员跨界表演,在3D、科幻化的深圳城市场景里习武,重新编排的舞剧《咏春》火爆出圈……

在岭南大地,文化艺术与科技同频共振,令人耳目一新。

在数字音乐行业规模保持全国领先的广州,当地文旅部门联合趣丸科技“天谱乐AI”打造出极具“羊城风韵”的AI音乐作品;在创新之都深圳,虚拟数字人“厘里”与真人演员跨界表演,在3D、科幻化的深圳城市场景里习武,重新编排的舞剧《咏春》火爆出圈……

AI、大数据等数字技术的发展,为岭南文化传承发展带来了新的契机,不仅使岭南文化传承从“经验传递”升维为“数据传承”,让文化真正“活”起来;更助力岭南文化“解锁”流量密码,实现破圈传播、跨界融合。

3月28日,岭南数字创意大厦新基建高质量发展大会在广州羊城创意产业园举行,现场正式挂牌成立岭南文化大数据中心,并发布岭南文化大模型,打造岭南文化数字高点。

依托岭南数字创意大厦,羊城晚报报业集团将通过建设、运营岭南文化大数据中心,夯实技术底座,推动岭南文化的数字化保存、智能化解析和产业化应用,为岭南文化的创造性转化、创新性发展增添新活力。

以数字文化赋能“百千万工程

在广东,岭南文化源远流长,拥有粤剧、古琴、剪纸、皮影、茶艺5项联合国教科文组织非遗代表作项目,醒狮、广绣等165项国家级非物质文化遗产代表性项目,全省核定公布不可移动文物2.5万余处,历史文化名城名镇名村数量居全国前列……这些丰富的文化资源,既构成岭南文化实体核心资源,也是岭南人民的共同记忆。

然而,在这些“岭南记忆”当中,超60%纸质文献档案因保存条件有限面临酸化、虫蛀风险,亟待抢救性扫描加固,只有30%左右的文物完成高清数字化采集,非遗项目数字化覆盖率不足25%,已数字化的资源中,90%停留于基础影像存档阶段。

缺少智能解析与活化应用,正让岭南文化的传承与发展面临诸多挑战。如何破解难题?数字赋能是重要手段。

中共中央、国务院此前印发的《关于推进实施国家文化数字化战略的意见》明确提出,2025年基本建成文化数字化基础设施和服务平台,2035年形成完备的国家文化大数据体系,中华文化全景呈现,中华文化数字化成果全民共享。作为改革开放的前沿和文化创新的窗口,广东扛起先行示范使命,率先打出了一套政策“组合拳”。

据不完全统计,广东近年来相继出台了《“数字湾区”建设三年行动方案》《广东省促进文化和科技深度融合实施方案(2021-2025年)》《广东省培育数字创意战略性新兴产业集群行动计划(2023—2025年)》等一系列促进数字文化科技、文化新业态快速发展的政策,数字化、智能化已然成为回应岭南文化传承和发展的关键词。

作为深耕岭南文化的人文大报,羊城晚报在承载历史回响、共筑城市精神的同时,也在打造独具岭南文化特色的融合发展之路。

广东岭创数字科技有限公司董事长丁华在介绍时指出,岭南文化大数据中心将以“1底座、2平台、3抓手、X场景”为架构,通过整合文脉、非遗、历史、民俗等文化资源,建设岭南文化大模型、线上数据服务平台和线下数字创意中心,打造数字村史馆、AI文旅自助导览、跨境IP交易所等百余项智能体应用,推动文化遗产数字化保护与活化利用。

在线下端,12万平方米的岭南数字创意中心将融合VR/AR、空间计算技术,打造出沉浸式的岭南数字文化体验馆。在线上端,上架“数据超市”“共创社区”等功能的岭南文化数据服务平台,也将聚焦岭南文化特色,并接入国家文化专网,实现岭南文化数据与国家总库双向流通,并建立全国首个跨境文化数据确权交易机制。

与此同时,岭南文化大数据中心也将成为推动“百县千镇万村高质量发展工程”的关键一环,届时将基于乡村级数据,打造出覆盖全省各县、乡、镇、村的数字村史馆,并以岭南数字文化体验馆为样板,推动“百县千镇万村文化体验工程”,三年内建成覆盖省内各县镇级文化体验馆,配备标准化数字展陈终端及动态更新展陈内容网络。

“我们计划五年后建成全球最大区域性文化数据库,数据总量超20PB;2028年数字文化产业达1200亿元,孵化5家独角兽;建设覆盖全省县镇村‘数字文化圈’,年服务5000万人次;‘云上岭南’日均跨国传播2000万次,打造3-5个全球百强IP。”丁华强调,该中心有望成为国家文化数字化的“华南支点”、粤港澳大湾区人文共同体的“数字桥梁”、中华文化国际传播的“超级路由器”、乡村振兴与共同富裕的“文化杠杆”。

交出“AI+文化”的跨界答卷

在人工智能的时代大潮中,跨界融合的趋势愈演愈烈,“AI+”在文化产业也擦出新的火花。

在视频生成大模型里输入“落霞与孤鹜齐飞,秋水共长天一色”,一键直出音画同步的国风视频;一条由1人制作的大型AIGC纪录片《山海经》刷爆了朋友圈,制作周期竟然不到8天。

在科技浪潮汹涌澎湃的当下,岭南文化如何守正创新?

“今年的政府工作报告中有很多提到‘文化’的部分,但最触动我的是持续推进‘人工智能+’行动的部署。”在全国政协委员、民进中央开明画院副院长舒勇看来,文化艺术发展一定要和科技同频共振,在人工智能的时代,只有借助AI这个“翅膀”,文化艺术才会走得更远、飞得更高。

早在两年前,舒勇就已开始尝试深层次的人工智能创作,每天用AI创作一张画,并在社交媒体分享。

对舒勇而言,他并不担心AI是否会取代自己的创作地位,因为所有的AI都是人类思想的直观反映。“它是我们的创作工具,就像一台思想的‘照相机’,把人类的思想、大脑里的潜意识,通过算法很好地‘照’出来”。因此他认为,文化与AI的共生将成为必然趋势,可以提高创作效率,拓展创作思路,创造出优秀作品。

在AI技术迅猛发展的当下,文化底色浓厚的媒体行业正加速向AI而行,构建新质生产力。

作为岭南文化大报,羊城晚报的“AI+”智媒尝试从未停步。携手网易互娱AI Lab推出广东首个媒体真人AI主播,和腾讯共创AI融媒体实验室,羊城派客户端接入DeepSeek……

站在新的风口上,羊城晚报交出了一份“AI+文化”的跨界答卷——在岭南文化大数据中心的建设蓝图下,它的数字底座正是由羊城晚报和智媒云图联合实验室研发的岭南文化大模型,这也是国内首个文化领域的多模态推理大模型。

这一大模型通过创新性的迭代蒸馏技术,将671B通识模型的关键能力转移到14B模型中,在文本理解上继承并展现出接近原版的推理能力,在图片、视频的多模态冷启动评测中领先OpenAI,在岭南文化这一垂直领域内拥有更为专业及准确的知识理解能力,开创国内垂直行业多模态推理大模型的技术新范式。

“我们构建的训练语料库基于高维度异构数据源整合,包括权威的岭南文化辞典、《羊城晚报》文脉专题报道以及大量非结构化的音视频影像资料,覆盖了粤剧、舞狮、剪纸、陶艺、刺绣等多维度地方艺术形态与历史建筑信息的知识图谱。”岭南文化大模型实验室主任邓立邦给出一组数据:大模型的数据有12大类、200多子类的多模态内容。

打造“最懂岭南文化”的大模型

“我们期待通过AI与文化的深度融合,让鑊耳屋的砖瓦风情、粤剧水袖的飘逸灵动、早茶氤氲的市井气息在数字世界中焕发新生。”邓立邦说。

实际上,用AI让岭南文化“活”起来绝非易事。在岭南文化大模型的训练过程中,最大的技术挑战在于结构化与非结构化数据的深度融合算法优化,这直接决定了模型的跨模态理解能力上限。

换句话说,岭南文化大模型既要看得懂脸谱、听得懂唱腔,又要跨越漫长的时间维度,去理解岭南文化的变迁。

“跨模态技术的核心难点在于向量空间映射问题,如何将文本特征向量与图像、音频特征向量精准对齐,并投射到同一高维语义网络空间。”邓立邦进一步解释,团队最终采用了分阶段迭代策略,先是攻克文本的深层语义理解与上下文推理能力,再去构建影像数据与文本数据之间的双向映射关系矩阵,最后基于统一向量空间解决多模态生成问题。

“幸运的是,我们可以在现有预训练大模型基础架构上进行蒸馏和微调,而非从底层重构整个技术栈。”经过15天371小时500多万步的训练,岭南文化大模型完成了蒸馏和微调。在测试录屏上,上传一段粤剧视频,模型能综合视频的场景布局、人物服饰动作、声音唱腔等,准确识别出在测试的粤剧剧目“紫钗记”。

当用户问起广州西关的木门“趟栊”,大模型能理解,并给出准确的文化解释;当用户上传一张岭南美食图片,并且问“哪些食物是咸的”,模型不仅能识别图片中的食物,还可以思考食物的具体做法,进行推理给出正确答案……

在他看来,作为国内“最懂岭南文化”的多模态推理型大模型,岭南文化大模型能在多个应用场景大显身手。在教育领域、旅游导览的交互场景中,教学、导览等依托的知识库通常具有明确的边界、相对固定的内容特性,因此岭南文化大模型在垂直领域的知识问答与创意内容生成方面将有出色表现。

想象一下,跟着岭南文化大模型一起学习粤语,学习剪纸、皮影等非遗制作;输入一个故事的主题,用大模型生成一段你想要的故事,再用粤剧的艺术形式生成一段戏曲……据估算,岭南文化大模型在2026年至2028期间将实现多模态交互及生成,将支撑超5000家小微文化企业创新发展。

值得注意的是,在岭南文化大模型的基础上,岭南文化大数据中心还将推出“岭南智算中心”和“岭南数字创意云”,利用新技术、新模式、新业态对传统非遗、传统岭南文化进行创造性转化和创新性发展,形成基于文化大模型的系列场景化工具箱、智能体的开放生态,汇聚行业内各类应用,切实降低中小文化企业数字化门槛。

文 | 记者 许张超 黄婷图|羊城晚报资料图

来源:羊城派

相关推荐