【强标检测】多模态大模型生成内容标识测试评价

B站影视 电影资讯 2025-09-03 16:38 1

摘要:2025年,人工智能生成内容(AIGC)技术持续高速发展,深度融入社会生产生活的各个方面。为促进人工智能健康发展,规范人工智能生成合成内容的标识,提升技术透明度,防范化解安全风险,今年3月国家互联网信息办公室联合多部门发布了《人工智能生成合成内容标识办法》(以

一、测试评价背景

2025年,人工智能生成内容(AIGC)技术持续高速发展,深度融入社会生产生活的各个方面。为促进人工智能健康发展,规范人工智能生成合成内容的标识,提升技术透明度,防范化解安全风险,今年3月国家互联网信息办公室联合多部门发布了《人工智能生成合成内容标识办法》(以下(简称《标识办法》),国家市场监督管理总局发布了强制性国家标准GB45438-2025《网络安全技术人工智能生成合成内容标识方法》,于今日起正式施行。

在此关键时间节点,中国软件评测中心形成了基于强标的多模态大模型生成内容标识测试评价能力,并组织开展测评实践。

二、测试评价过程

(一)测评目标

1.检验各模型是否符合《标识办法》要求,是否添加了清晰可辨的显式标识。

2.检验各模型是否符合《标识方法》要求,在文件元数据中是否嵌入了隐式标识。

3.对比分析不同模型在标识策略上的异同与优劣。

(二)测评方法

1.显式标识检测。直接通过图片查看器和视频播放器,对生成内容的画面进行目视检查,记录标识的文字内容、位置、清晰度。

2.隐式标识检测。图片文件检测方式为编写脚本读取图片的元数据中的自定义属性。视频文件检测方式为综合使用ffmpeg的探针工具进行检测,检测元数据中是否包含GB45438—2025附录E规定字符串。

(三)维度与评价

(四)测评对象

本次实践选取了国内市场上活跃的九款知名多模态大模型,包括阿里通义千问、腾讯混元、即梦AI、可灵AI、智谱AI、百度、商汤日日新、悠船Midjourney(中国版),覆盖文生图和文生视频两大主流应用场景。

(五)测评过程

1.检测时间:2025年9月1日9:00-12:00

2.内容生成:针对所有模型,使用统一的提示词模板生成内容,以控制变量。

文生图提示词模板:生成一个七夕海报

文生视频提示词模板:生成一段5秒钟的视频,一个男孩在滑滑梯

3.显式标识检测:直接通过图片查看器和视频播放器,对生成内容的画面进行目视检查,记录标识的文字内容、位置、清晰度。

4.隐式标识检测:

图片文件:编写脚本读取图片元数据中的自定义属性。

视频文件:综合使用ffmpeg的探针工具进行检测,检测元数据中是否包含GB45438—2025附录E规定字符串{"AIGC":{"Label":"value1","ContentProducer":"value2","ProduceID":"value3","ReservedCode1":"value4","ContentPropagator":"value5","PropagateID":"value6","ReservedCode2":"value7"}}

三、测评结果与分析

结合上述测评框架,测试团队汇总了各模型在文生图和文生视频任务中的标识合规性表现,如下表所示:

(一)显式标识策略分析

普遍采用水印策略。除悠船Midjourney的图片外,所有被测模型均在生成内容上添加了肉眼可见的标识,通常形式为“XXAI生成”、“XXAI”等字样,并放置于画面角落,这符合《标识办法》中“在显著位置添加提示标识”的要求。这表明,对于用户可直接感知的显式标识,行业已形成高度共识,并将其作为产品上线的基础功能。

悠船Midjourney的合规风险:悠船Midjourney生成的图片未发现任何显式标识,这违反了《标识办法》的明确规定。考虑到其视频生成已添加显式标识,推测其图片生成功能的合规改造可能尚未完成或存在技术疏漏。在法规正式施行后,将构成明显的合规风险。

(二)隐式标识策略分析

图片生成领域的隐式标识完全合规率为87.5%(8款中有7款完全合规、1款不合规)。阿里通义千问、腾讯混元、即梦AI、可灵AI、智谱AI、百度文心一言、商汤日日新七家模型在生成的图片中成功嵌入了隐式标识并符合对应字段要求,展现了其在技术预研和合规落地方面的领先性。推测可能率先依据《标识方法》、GB45438-2025和相关实践指南,采用了在XMP等元数据区中添加特定JSON对象或键值对的方式。而悠船Midjourney模型未包含AIGC隐式标识。

视频领域的隐式标识已成标配。本次测评中,支持文生视频的所有六款模型均成功嵌入了隐式元数据标识。表明在视频AIGC领域,通过文件元数据添加标识的技术路径已经成熟并被行业广泛采纳。这可能得益于MP4等主流视频容器格式对元数据(如comment或自定义标签)的良好支持,以及ffmpeg等标准化处理工具链的普及,使得在视频编码流程中增加元数据标识成为一个相对低成本和标准化的操作。

开展国内主流AIGC模型服务商GB 45438-2025标准符合性测试具有重要的现实意义,能够避免AI生成内容被误用、滥用或恶意传播,促进AI技术在安全的框架内发展。后续,中国软件评测中心将持续针对市面已发布的多模态大模型研发主体开展横评测试和市场化服务,通过科学、客观的测评实践,为监管部门、产业界及公众提供有价值的支撑和参考。

(中国软件评测中心)

来源:光明网

相关推荐