【人民法治学术委员会】王春晖:人工智能生成合成内容应履行标识义务

B站影视 内地电影 2025-03-24 14:01 2

摘要:随着人工智能技术的飞速发展,以ChatGPT、Claude、Gemini、DeepSeek、Qwen等为代表的大语言模型正以前所未有的方式改变着我们的工作和生活方式,海量数据生成合成并在网络平台传播,正在重构信息生产与传播范式。从生成合成文本、图像到音视、视频

随着人工智能技术的飞速发展,以ChatGPT、Claude、Gemini、DeepSeek、Qwen等为代表的大语言模型正以前所未有的方式改变着我们的工作和生活方式,海量数据生成合成并在网络平台传播,正在重构信息生产与传播范式。从生成合成文本、图像到音视、视频,人工智能技术生成合成内容在促进经济发展、丰富网上内容、便利公众生活、提升工作学习效率、降低创作门槛的同时,也催生了虚假信息传播、版权侵权争议、损毁公众对信息的信任,破坏网络生态等。如何构建多维度治理框架,平衡人工智能技术发展与监管创新,已成为各国共同面临的问题。

鉴于人工智能生成合成技术可大规模产出与人类创作高度相似的内容,多数国家通过立法强制性要求企业履行内容标识义务,通过技术溯源以及显式和隐式标识,确保公众能快速识别人工智能生成合成内容的来源,抑制虚假信息的泛滥。2024年实施的欧盟《人工智能法案》明确要求,对高风险人工智能系统实施了严格的透明度要求,所有由人工智能生成的文本、图像、音频、视频等内容必须明确标注为“人工智能生成”,且需通过技术手段(如数字水印、元数据嵌入等)确保可追溯性。2024年8月,美国加州公布的AB-3211《加州数字内容溯源标识法案》明确要求,所有科技公司在人工智能生成的图像和视频的元数据中嵌入水印。根据AB-3211法案,添加到人工智能生成内容的来源数据必须包括有关内容的合成性质、生成人工智能提供商的名称、添加来源数据的时间和日期以及内容的哪些部分是人工智能生成的信息。2025年3月,西班牙政府批准了一项新法案,要求企业在使用人工智能生成的内容时必须清晰标识,违规企业将面临最高3500万欧元的罚金,相当于全球年营业额7%的罚金。

一、 人工智能生成合成的技术逻辑

人工智能生成合成内容是指利用人工智能技术生成、合成的文本、图片、音频、视频、虚拟场景等信息。上述定义包含两类技术,一是人工智能生成技术;二是人工智能深度合成技术。

首先,人工智能生成技术,是一种基于算法、模型和规则,能够生成文本、图片、声音、视频等多元内容的技术。不同于传统的人工智能仅对输入数据进行处理和分析,生成式人工智能可以学习并模拟事物的内在规律,根据用户的输入资料生成具有逻辑性和连贯性的新内容。这一技术的核心是通过海量数据预训练掌握语言规则、图像构成等知识框架,依赖多模态大模型,实现跨文本、视觉、听觉等异构数据的统一处理与生成,最终生成符合人类需求的新内容。

我国DeepSeek大模型在技术逻辑架构方面有着诸多亮点,特别是采用了“混合专家”(Mixture of Experts,MoE)架构、多头潜在注意力(MLA)技术等,这些技术创新极大地提升了模型的性能。尤其是 MoE 架构,通过引入多个独立的专家模型,每个输入数据只选择和激活其中一部分专家模型来处理,从而减少计算量并提高训练和推理速度。在自然语言处理任务中,不同的专家可以分别专注于语法、语义等不同方面,就像一个分工明确的团队,每个成员负责自己擅长的部分,从而提高整体效率。这种架构在 DeepSeek - v3 模型中体现得淋漓尽致。

其次,人工智能深度合成(Deep Synthesis)技术,也被称为深度伪造(Deepfake),是指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术。深度合成技术包括但不限于:1.篇章生成、文本风格转换、问答对话等生成或者编辑文本内容的技术;2.文本转语音、语音转换、语音属性编辑等生成或者编辑语音内容的技术;3.音乐生成、场景声编辑等生成或者编辑非语音内容的技术;4.人脸生成、人脸替换、人物属性编辑、人脸操控、姿态操控等生成或者编辑图像、视频内容中生物特征的技术;5.图像生成、图像增强、图像修复等生成或者编辑图像、视频内容中非生物特征的技术;6.三维重建、数字仿真等生成或者编辑数字人物、虚拟场景的技术。

人工智能深度合成技术可以将一个人的面部表情、言辞和动作应用到其他人的图像或视频上,使生成的内容看似原始内容。由于深度合成技术门槛快速降低,导致滥用合成技术的案例频出,引发各类风险。比如有人克隆雷军的声音,制作恶搞视频,有人伪造香港艺人刘德华和中国工程院院士张伯礼的音视频,为自己带货等。特别是利用人工智能深度合成技术模仿人脸效果和模拟声音,更易取得对方信任,已成为犯罪分子实施电信诈骗的主要技术手段。2025年两会期间,滥用人工智能换脸和人工智能拟声成为代表们热议的焦点。

二、人工智能生成合成内容治理的中国实践

我国高度重视人工智能生成合成内容治理,早在2021年12月,我国就发布《互联网信息服务算法推荐管理规定》(简称:《算法推荐管理规定》)。《算法推荐管理规定》第九条明确规定,算法推荐服务提供者应当加强信息安全管理,建立健全用于识别违法和不良信息的特征库,完善入库标准、规则和程序。发现未作显著标识的算法生成合成信息的,应当作出显著标识后,方可继续传输。这是我国首次在部门规章层面提出对算法生成合成的信息,应当进行显著标识。

2022年11月,我国发布的《互联网信息服务深度合成管理规定》(简称:《深度合成管理规定》)明确要求在生成或者编辑的信息内容的合理位置、区域进行显著标识。《深度合成管理规定》规定,深度合成服务提供者提供以下五类深度合成服务,可能导致公众混淆或者误认的,应当在生成或者编辑的信息内容的合理位置、区域进行显著标识,向公众提示深度合成情况:一是智能对话、智能写作等模拟自然人进行文本的生成或者编辑服务;二是合成人声、仿声等语音生成或者显著改变个人身份特征的编辑服务;三是人脸生成、人脸替换、人脸操控、姿态操控等人物图像、视频生成或者显著改变个人身份特征的编辑服务;四是沉浸式拟真场景等生成或者编辑服务;五是其他具有生成或者显著改变信息内容功能的服务。

2023年7月,国家网信办联合国家和发展改革委员会、教育部、科技部、工业和信息化部、公安部、广电总局等七部门联合公布《生成式人工智能服务管理暂行办法》(简称:《暂行办法》),这是全球首部全面监管生成式人工智能的立法。《暂行办法》第十二条进一步明确:生成式人工智能服务提供者应当按照《互联网信息服务深度合成管理规定》对图片、视频等生成内容进行标识。

2025年3月,国家网信办、工业和信息化部、公安部、国家广播电视总局联合发布《人工智能生成合成内容标识办法》(以下简称《标识办法》),与《标识办法》配套的国家强制性标准《网络安全技术 人工智能生成合成内容标识方法》(下称《标识方法》)同时发布,并于2025年9月1日起同日实行。这意味着我国将全方位、立体化地规范和治理人工智能生成合成内容标识活动和方法。至此我国利用人工智能生成合成内容将实行强制标识,“哪些是生成的”“谁生成的”“从哪里生成的”必须明确标识,推动由生成合成到传播各环节的全流程安全管理,以构建可信赖的人工智能生成合成内容服务生态。明确标识人工智能生成合成内容,不仅能够帮助公众正确理解和评估信息的来源与可信度,而且可以避免因误信人工智能生成合成内容而产生错误判断或导致安全风险。

三、《标识办法》的适用范围与标识形式

根据《标识办法》第二条的规定,符合《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》规定情形的网络信息服务提供者(以下简称“服务提供者”)开展人工智能生成合成内容标识活动,适用本办法。

首先,应用算法推荐技术,是指利用生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等算法技术向用户提供信息。《算法推荐管理规定》第二条规定:在中华人民共和国境内应用算法推荐技术提供互联网信息服务(以下简称算法推荐服务),适用本规定。法律、行政法规另有规定的,依照其规定。

其次,人工智能深度合成技术,是指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术。《深度合成管理规定》第二条规定:在中华人民共和国境内应用深度合成技术提供互联网信息服务,适用本规定。法律、行政法规另有规定的,依照其规定。

再次,《暂行办法》第二条规定:利用生成式人工智能技术向中华人民共和国境内公众提供生成文本、图片、音频、视频等内容的服务(以下称生成式人工智能服务),适用本办法。《暂行办法》同时规定,国家对利用生成式人工智能服务从事新闻出版、影视制作、文艺创作等活动另有规定的,从其规定。《暂行办法》明确了不适用该办法的情形,即行业组织、企业、教育和科研机构、公共文化机构、有关专业机构等研发、应用生成式人工智能技术,只要未向境内公众提供生成式人工智能服务的,不适用本办法的规定。

《标识办法》明确了人工智能生成合成内容标识的两种形式:一是显式标识,主要指在生成合成内容或者交互场景界面中添加的,以文字、声音、图形等方式呈现并可以被用户明显感知到的标识;二是隐式标识,主要指采取技术措施在生成合成内容文件数据中添加的,不易被用户明显感知到的标识。

(一)显式标识:包括内容显式标识、交互场景界面显式标识,内容显式标识和交互场景界面显式标识分为文本类、图片类、音频类、视频类、虚拟场景类,比如在内容显式标识中的文本类中添加文字或角标,提示内容由人工智能生成合成;在交互场景界面显式标识中的文本、图片、音频显示区域附近持续显示提示文字等。

(二)隐式标识:包括文件元数据隐式标识、内容隐式标识等,其中文件元数据是按照特定编码格式嵌入到文件中的描述性数据,用于记录文件来源、属性、用途、版权等信息;内容隐式标识是在人工智能生成合成内容数据中添加的数字水印等形式的隐式标识。

四、各主体相关标识义务的认定边界

生成式人工智能生成合成内容涉及多种类型的主体,《标识办法》明确界定了服务提供者、传播平台、互联网应用程序分发平台和用户的相关标识义务。

(一)服务提供者的标识义务

1.服务提供者的显式标识义务。根据《标识办法》第四条的规定,服务提供者提供生成合成服务属于智能对话、智能写作等模拟自然人进行文本的生成或者编辑服务,应当按照下列要求履行对生成合成内容添加显式标识的义务:

一是在文本的起始、末尾或者中间适当位置添加文字提示或者通用符号提示等标识,或者在交互场景界面、文字周边添加显著的提示标识;二是在音频的起始、末尾或者中间适当位置添加语音提示或者音频节奏提示等标识,或者在交互场景界面中添加显著的提示标识;三是在图片的适当位置添加显著的提示标识;四是在视频起始画面和视频播放周边的适当位置添加显著的提示标识,可以在视频末尾和中间适当位置添加显著的提示标识;五是呈现虚拟场景时,在起始画面的适当位置添加显著的提示标识,可以在虚拟场景持续服务过程中的适当位置添加显著的提示标识;六是其他生成合成服务场景根据自身应用特点添加显著的提示标识。《标识办法》强调,服务提供者提供生成合成内容下载、复制、导出等功能时,应当确保文件中含有满足要求的显式标识。

2. 服务提供者的隐式标识义务。《深度合成管理规定》第十六条规定,深度合成服务提供者对使用其服务生成或者编辑的信息内容,应当采取技术措施添加不影响用户使用的标识,并依照法律、行政法规和国家有关规定保存日志信息。《标识办法》第五条要求,深度合成服务提供者应当按照《深度合成管理规定》的上述要求,在生成合成内容的文件元数据中履行添加隐式标识的义务。隐式标识主要包含生成合成内容属性信息、服务提供者名称或者编码、内容编号等制作要素信息。《标识办法》鼓励服务提供者在生成合成内容中添加数字水印等形式的隐式标识。针对在文本内容中添加隐式标识,在多媒体文件中添加数字水印,仍是技术难点或可能增加企业成本,对此《标识办法》没有作强制要求。

服务提供者除履行上述标识义务,还应当在用户服务协议中明确说明生成合成内容标识的方法、样式等规范内容,比如内容显式标识应体现分为文本、图片、音频、视频、虚拟场景等显式标识,交互场景界面显式标识可在内容附近的显式标识和交互场景界面适当位置的显式标识。同时,应提示用户仔细阅读并理解相关的标识管理要求。

(二)传播平台的核验义务

《标识办法》第六条要求提供网络信息内容传播服务的服务提供者采取四项措施,规范生成合成内容传播:一是核验文件元数据中是否含有隐式标识,文件元数据明确标明为生成合成内容的,采取适当方式在发布内容周边添加显著的提示标识,明确提醒公众该内容属于生成合成内容;二是文件元数据中未核验到隐式标识,但用户声明为生成合成内容的,采取适当方式在发布内容周边添加显著的提示标识,提醒公众该内容可能为生成合成内容;三是文件元数据中未核验到隐式标识,用户也未声明为生成合成内容,但提供网络信息内容传播服务的服务提供者检测到显式标识或者其他生成合成痕迹的,识别为疑似生成合成内容,采取适当方式在发布内容周边添加显著的提示标识,提醒公众该内容疑似生成合成内容;四是提供必要的标识功能,并提醒用户主动声明发布内容中是否包含生成合成内容。其中有第一项至第三项情形的,应当在文件元数据中添加生成合成内容属性信息、传播平台名称或者编码、内容编号等传播要素信息。

(三)应用服务分发平台的审核义务

互联网应用服务分发平台是移动互联网生态中的重要组成部分,主要功能包括应用分发、管理、审核、营销推广和数据分析等。应用服务分发平台为开发者提供了一个统一、易于管理的环境,帮助他们更专注于应用的开发和改进。同时,平台会对上传的应用程序进行严格的审核,确保应用的质量、可信和安全,严防虚假信息、恶意代码和漏洞的存在。《标识办法》第七条要求,互联网应用程序分发平台在应用程序上架或者上线审核时,应当要求互联网应用程序服务提供者说明是否提供人工智能生成合成服务。互联网应用程序服务提供者提供人工智能生成合成服务的,互联网应用程序分发平台应当核验其生成合成内容标识相关材料。

(四)用户的标识义务

当今,自媒体用户已经成为互联网生态中的重要组成部分,他们通过创作和分享内容,推动了信息传播和文化交流。随着人工智能生成合成技术的快速发展,用户对各类人工智能生成合成的内容都表现出浓厚的兴趣,涵盖时事新闻、社会热点、科技、财经、历史、文化、娱乐等多个领域。用户对视频内容的喜好尤为突出,涵盖了生活记录、知识分享、娱乐搞笑、美食、旅游等诸多场景。

《标识办法》对用户使用网络信息内容传播服务发布生成合成内容作出了明确的要求:首先,用户发布人工智能生成合成内容应当主动声明;其次,应当使用服务提供者提供的标识功能进行标识。如果用户申请服务提供者提供没有添加显式标识的生成合成内容的,服务提供者可以在通过用户协议明确用户的标识义务和使用责任后,提供不含显式标识的生成合成内容,并依法留存提供对象信息等相关日志不少于六个月。

为了确保各主体利用人工智能生成合成内容履行标识义务,《标识办法》规定了三条禁令:一是任何组织和个人不得恶意删除、篡改、伪造、隐匿本办法规定的生成合成内容标识;二是任何组织和个人不得为他人实施上述恶意行为提供工具或者服务;三是任何组织和个人不得通过不正当标识手段损害他人合法权益。

五、国家强制性标准支撑《标识办法》有效实施

与《标识办法》配套的国家强制性标准《网络安全技术 人工智能生成合成内容标识方法》(简称《标识标准》)于2025年9月1日同步实施。《标识标准》主要依照《标识办法》等有关法律法规,以强制性国家标准的形式提出人工智能生成合成添加显式标识和隐式标识的具体实施方式和操作方法。

按照标识对象,显式标识可分为内容显式标识、交互场景界面显式标识。内容显式标识可进一步分为文本、图片、音频、视频、虚拟场景等显式标识;交互场景界面显式标识可进一步分为在内容附近的显式标识和交互场景界面适当位置的显式标识。比如文字形式,使用“AI生成”提示文字,位于文本起始位置的内容显式标识;图片内容显式标识使用“人工智能生成合成”提示文字,位于图片右下角的内容显式标识;视频内容显式标识使用“人工智能生成合成”提示文字,位于视频起始画面右下角的内容显式标识示等。

隐式标识按照标识位置可分为文件元数据隐式标识、内容隐式标识(例如在生成合成内容中添加的数字水印)等。文件元数据隐式标识应包括以下要素:1.生成合成标签要素:内容的人工智能生成合成属性信息;2.生成合成服务提供者要素:生成合成服务提供者的名称或编码;3.内容制作编号要素:生成合成服务提供者对该内容的唯一编号;4.内容传播服务提供者要素:内容传播服务提供者的名称或编码;5.内容传播编号要素:内容传播服务提供者对该内容的唯一编号。关于内容隐式标识准许采用数字水印等形式。

《标识办法》和《标识标准》通过“显式+隐式”双轨标识,构建了人工智能生成合成内容的前端透明与后端可信体系。显式标识强制保障用户知情权,隐式标识强化溯源能力,二者协同将平衡人工智能生成合成技术的应用与安全。相关责任主体需依照相关法律、法规、规章的规定和国家强制性标准的要求,强化人工智能生成合成标识技术能力建设,做好应对未来人工智能技术迭代与生态协同的挑战。

作者:王春晖,浙江大学教授、浙江大学网络空间国际治理研究基地首席专家,中国科协决策咨询首席专家,工信部信息通信经济专家委员会委员,中国行为法学会学术委员会副主任兼网络与数据法学研究部主任,中国法学会网络与信息法学研究会常务理事,人民法治学术委员会副主任。

来源:人民法治

相关推荐