摘要:自“清朗·整治AI技术滥用”专项行动开展以来,北京市委网信办贯彻落实中央决策部署,全面加强AI技术全链条监管,推动形成政府监管、企业履责、社会共治的治理格局。经过第一阶段集中攻坚,全市AI技术滥用治理取得阶段性成效,网络生态持续净化。
自“清朗·整治AI技术滥用”专项行动开展以来,北京市委网信办贯彻落实中央决策部署,全面加强AI技术全链条监管,推动形成政府监管、企业履责、社会共治的治理格局。经过第一阶段集中攻坚,全市AI技术滥用治理取得阶段性成效,网络生态持续净化。
加强工作组织
压实企业主体责任
一是制定《北京市“清朗·整治AI技术滥用”专项行动实施方案》,明确整治重点,提出整治任务,细化工作具体安排。上线全国首个省级AI技术滥用治理举报渠道,依托“网信北京”“京通”等平台宣传推广,收集网民举报线索,及时研判处置,形成“用户标记—平台核查—联合处置”工作模式,目前已处置AI技术滥用、谣言等举报26篇。
二是组织属地重点互联网企业开展自查自纠,覆盖大模型备案、数据训练、内容审核、产品功能等全环节。京东新增100个AI特征敏感词,拦截违规内容;昆仑万维、零一万物等企业完善训练语料清洗机制,防范虚假信息、违规内容传播等。
三是组织技术支撑团队,重点核查API接口接入、医疗金融问答、未成年人保护等高风险领域。督促重点网站平台加强训练语料管理、提高内容审核效率等。
重拳出击
整治成效凸显
一是违规产品与内容全力遏制。全市已备案大模型企业截止目前未发现“一键脱衣”“声音克隆”等违规功能。微博清理传播教授AI换脸教程类内容162条,关闭账号22个,清理分享售卖违规AI产品类有害信息234条,关闭账号52个;抖音清理AI生成的虚假信息、低俗内容等24749条等。
二是训练数据治理初见成效。提升数据来源合规率,百度对存量数据进行整体清洗,使用211个权威网站的正能量数据源;百川停止使用存在疑问的数据来源,制定严格的网络爬取规范,确保数据合规合法。强化敏感内容过滤,360、深言科技等企业优化语义识别模型,提高涉政、涉黄内容拦截准确率等。
三是重点领域风险有效防控。医疗金融领域方面,智谱明确禁止生成具体股票推荐、基金购买建议,避免诱导高风险投资;快手对医疗回答明确标注“不替代专业医疗建议”。未成年人保护方面,猿力科技对未成年人提问进行分级审核,仅允许教育类内容生成;小米通过实名认证和年龄校验,限制未成年人使用AI生成暴力内容等敏感功能。
四是标识管理与技术能力双突破。显隐标识覆盖近半,目前已有近60家企业已落实标识要求,微博、抖音等平台实现生成内容“显著标识+元数据水印”双标注。攻防技术升级,百度、字节跳动等企业建立“红蓝对抗”机制,模拟攻击案例,修复潜在安全漏洞,优化模型对虚假信息的识别能力等。
健全长效治理机制
一是持续督促指导平台落实标识要求,建设标识能力。督促AI服务提供者按照《互联网信息服务深度合成管理规定》,参照《人工智能生成合成内容标识办法》,对文本、音频、图片、视频等生成合成内容进行标识,防止公众混淆或者误认。指导内容传播平台参照《人工智能生成合成内容标识办法》要求,配备生成合成内容标识功能,构建生成合成内容检测识别能力,对生成合成内容进行标识。
二是强化企业培训。针对企业关注的合规政策、扶持政策、技术交流等痛点需求,对平台企业进行宣讲解读、培训,助力平台企业合规发展。
三是构建多元共治格局。利用协会、科研院所力量,指导成立“AI安全治理联盟”,进行技术对接、企业参访、开放研讨等,交流AI治理经验,重点突破深度伪造检测、多模态内容溯源等关键技术,提高全市AI治理水平。持续畅通网民举报渠道,加强公众参与,提升社会监督意识。
北京市互联网信息办公室官方微信
首都互联网协会官方微信
来源:网信北京