摘要:近年来,我国持续推进数据要素市场培育和全国一体化数据市场建设,但在实践中仍面临可信数据流通环境缺失的制约,存在数据“供给难、互信难、流通难、监管难”等“瓶颈”,进而引发各主体在数据共享利用上存在“不敢用、不愿用、不能用”的问题。破题的关键在于构建可信数据空间,
文 | 新华三集团高级副总裁、新华三信息安全技术有限公司总裁 孙松儿
近年来,我国持续推进数据要素市场培育和全国一体化数据市场建设,但在实践中仍面临可信数据流通环境缺失的制约,存在数据“供给难、互信难、流通难、监管难”等“瓶颈”,进而引发各主体在数据共享利用上存在“不敢用、不愿用、不能用”的问题。破题的关键在于构建可信数据空间,它既是一种新型数字基础设施,也是多方参与的数据生态系统。可信数据空间的建设和运营需要统筹发展与安全两大命题:在技术层面,依托隐私计算、区块链、数据确权等技术,实现数据可控可计量、可溯可追责,筑牢信任基石;在制度层面,通过政策引导与商业模式创新,激发数据汇聚共享与融合应用活力,充分释放数据要素核心价值。
数据要素的市场化配置和价值释放已成为我国数字经济时代的核心任务。近年来,围绕构建全国统一的数据要素市场,中央和各部委密集出台政策文件。其中具有标志意义的是2024年11月国家数据局发布的《可信数据空间发展行动计划(2024—2028年)》(以下简称《行动计划》),并提出到2028年建成100个以上可信数据空间的建设目标。这一目标意味着,未来几年内将在全国范围内培育大量不同类型的数据空间,并通过互联互通形成“数据空间网络”,为各行业、各地区提供广泛覆盖、互信互认的数据要素流通渠道。
可信数据空间的政策出台,是对当前数据要素流通困境的深刻认识和对未来数字中国建设需求的前瞻把握:一方面,数字化转型迫切要求打破数据孤岛,实现跨部门、跨行业的数据共享共用,但信任缺失和安全担忧使数据供需双方“不敢给、不能用”;另一方面,人工智能、大数据等新技术的发展需要汇聚海量高质量数据,传统分散的数据管理模式难以支撑数据要素的规模化流通。因此,国家层面迫切需要搭建一个可信、安全、高效的数据流通新型基础设施,降低数据流通的制度性交易成本,保障数据要素在更大范围内合规高效流动。可信数据空间正是在这一时代需求下被提升到国家战略高度,成为撬动数据要素市场的“关键支点”和打开数据价值之门的“金钥匙”。
针对可信数据空间的长远发展,政策从技术、标准、运营、生态、安全等方面提出一系列指标和建设任务:一是三大功能定位,分别从数据可信管控能力、资源高效交互能力、价值共创能力对应数据要素流通中的“信任、安全、价值创造”三个关键环节,指明了可信数据空间建设的基本方向。二是五类空间形态,以“分类施策”推进企业、行业、城市、个人、跨境五类可信数据空间形态的建设和应用,涵盖了从微观企业到宏观国际的数据流通应用场景,体现了政策对不同层次数据空间发展的统筹规划。三是四项基础支撑措施,从标准规范、技术攻关、制度治理与试点示范四大方面保障可信数据空间建设顺利推进。
总体来看,自2023年以来我国可信数据空间政策体系日趋完善,多层次、多维度的政策合力正在形成。对这一系列政策可解读出几个关键词:可信、安全、共享、价值。可信是前提,安全是底线,共享是手段,价值是目的。
二、可信数据空间建设面临的挑战
在国家政策的引导下,各类市场主体看到了数据要素流通的新机遇,纷纷投入可信数据空间的建设热潮中。但可信数据空间在建设发展中不可避免地面临一些挑战,需要引起重视并逐步加以克服。
其一,多方参与的复杂身份互信和权限控制仍需技术和治理上的创新。数据空间通常涉及跨组织、跨系统的众多参与者(提供方、使用方、运营方等),如何建立统一、权威的身份标识体系,确保各方身份真实可信且可追溯,是构建信任基石的关键。针对传统孤立的身份系统难以互通的问题,需重点解决跨域身份认证、联邦身份管理以及权威根信任源的建立问题。此外,面对数据流通场景复杂多变,权限控制需随数据敏感度、使用场景、参与方角色及合约条款动态调整,这对权限的细粒度控制提出了更高要求。
其二,数据安全风险依然是悬在可信数据空间上的“达摩克利斯之剑”。一方面,数据在全生命周期中的形态和价值不断变化,传统静态数据分类分级规则难以适配,需要实时、智能的数据探查能力,从而准确识别融合数据的敏感属性和合规风险点。另一方面,随着更多数据在空间中流动,攻击者可能通过技术手段窃取敏感数据或篡改数据记录,因此,必须通过系统化的数据安全治理持续提升数据空间的安全保障水平。
其三,数据的可信交付问题仍需结合场景需求持续探索。一方面,“数据可用不可见”成为可信数据空间中数据交付的重要场景,如何解决数据的隐私保护与价值释放的平衡成为挑战。另一方面,在统一的数据空间内如何实施全局有效的映射规则和互认机制,也是实现数据可信交付的难点所在。
三、技术创新驱动下的可信数据空间实践探索
当前,可信数据空间的发展已从概念探索迈入规模化试点与生态构建的加速落地阶段,需要技术创新与生态实践双轨并行,从而实现安全、高效、可控的数据流通。新华三基于自身在ICT领域的技术积累与对行业数字化需求的深刻理解,推出了面向数据要素流通的可信数据空间解决方案。通过搭建“可信数据空间流通服务平台”和“可信数据空间接入一体机”两个核心子系统,实现了“构建接入认证体系、统一接口要求,联通各类数据空间节点”的目标。
(一)以技术创新,解决可信数据空间可信、安全、效率难题
围绕可信、安全、效率三大维度,新华三可信数据空间方案融合了多种前沿技术,以解决跨域互信这一根本挑战,推动实现“数据可流通,价值可释放”的最终目标。
首先,在身份与权限管理方面,方案提供了统一的身份认证和细粒度授权机制,确保“空间参与各方身份可信、权责清晰”。通过统一身份认证和多因素认证,用户严格认证后方可接入数据空间。同时,通过角色与权限精细化管理,管理员可以基于组织职能为用户分配不同角色,并针对具体数据资源设定访问控制策略,实现基于角色的访问控制(RBAC)与基于属性的访问控制(ABAC)相结合,保障数据空间的访问安全。
其次,在数据全生命周期管理方面,方案全面构建了覆盖数据“登记—分类—探查—同步—监控—下架”的全流程管理体系。通过支持数据资源的在线登记与元数据管理,内置对接各类数据库、文件系统的数据探查功能,自动摸底数据源结构和内容,为数据治理提供依据。同时,数据资源可以按照行业或敏感程度进行分类分级标注,方便数据管理部门和提供方按照监管要求对数据进行标识和分级管理。在数据流通过程中,通过多种数据同步策略(定时同步、实时推送等)保证不同系统间的数据一致性与完整性,为跨库、跨系统的数据融合打下基础。通过监控预警能力,实现日志归集和可视化驾驶舱,实时监控数据流通状态,一旦出现异常数据流动或安全事件,可及时告警处置。
再次,在数据合规与安全保护方面,通过内置强大的数据合规检测引擎,支持对多种类型数据(文本、表格、图像、音频、视频等)的内容进行合规性评估,确保数据内容符合国家法律法规和行业监管要求。同时,通过数据脱敏、水印、数字证书等多重安全功能,贯穿数据在存储、传输、使用各环节,构成完善的数据安全防护体系。
为解决数据共享中的“信任赤字”问题,方案创新引入了隐私保护计算框架,实现数据“可用不可见”的目标。依托联邦学习、安全多方计算(MPC)在内的多种隐私计算工具,实现数据不出本地的联合分析建模。通过区块链分布式账本,在链上记录数据流通操作和智能合约的执行结果,形成不可篡改的行为存证链。多种技术的互补优势,使数据空间具备“数据在不同主体间‘可用不可见’‘可控可计量’”的关键能力。
可信数据空间的落地不仅要关注数据空间的安全合规,还需要注重提高其智能化水平和运行效率,为数据空间的规模化应用提供技术保障。针对跨域异构数据交换难题,新华三引入“知识图谱+大模型”驱动的语义对齐技术,通过构建统一的数据要素语义模型和行业知识图谱,以及自然语言处理的大模型辅助,实现不同机构数据字段和格式的自动映射转换,减少人工对接成本,提高数据交换准确率。在数据治理方面,设计多智能体协同机制,在资源受限的终端设备上部署轻量化智能代理,完成数据采集、初步清洗等任务,再将繁重计算委托云端代理处理,并通过强化学习优化多代理间的任务分配。
(二)以生态发展,推动可信数据空间落地实践与行业应用
在数据要素价值释放的关键期,行业数据流通常囿于信任缺失与协作壁垒。可信数据空间的行业应用将进一步释放数据潜能、驱动产业升级,通过深入典型行业场景,新华三正在积极推动数据流通从封闭走向开放、从无序走向规范。
针对政府政务数据共享场景,某地方政府依托新华三可信数据空间构建起跨部门的数据共享交换门户,将公安、社保、医疗、交通等部门的数据统一登记管理,并通过严格的权限控制和合规检测,使各部门在依法依规的前提下按需共享数据,实现了政务数据利用效率和安全水平双提升,一些原本需要群众“来回跑、提交材料”的事项因为部门间数据打通而实现了自动核验和“一网通办”。
面对金融行业数据管理的高要求,某大型金融机构上线新华三可信数据空间,对分散在不同业务条线的数据资产统一治理。平台的数据合规检测功能帮助其满足了金融行业严格的监管合规要求,敏感客户信息在流通前都经过脱敏处理;同时,隐私计算模块支持该机构在保护客户隐私的前提下与第三方共享数据,联合开展风控模型训练,有效提升风控准确率。
面向企业内部数据流通场景,某制造企业通过新华三可信数据空间打通了内部各子公司、部门的数据墙,实现生产、销售、服务等环节的数据融合分析。借助平台的分类分级和权限管控,该企业既保障了商业敏感数据在内部共享时的安全,又极大提升了数据调用效率,为经营决策提供了及时准确的数据支撑。
目前,新华三已在城市级、行业级、企业级等多种场景中实现可信数据空间方案的落地应用。一方面,作为技术提供方赋能相关可信数据空间的建设落地;另一方面,积极参与可信数据空间生态的培育,联合产业各方探索数据空间的商业模式,如数据要素定价、收益分配等,推动形成可持续的可信数据空间运营模式。
四、结 语
当前,国家数据局正在加紧出台可信数据空间相关的建设指南和运营规范,地方政府也在试点中探索可行的治理模式。可以预见,随着政策引导和技术进步,可信数据空间在落地过程中的问题和挑战将逐步得到解决。同时,技术领域对区块链扩展性、隐私计算效率的改进将逐步降低数据空间运营成本,人工智能的引入将提升数据空间中数据资产的管理和挖掘能力,这些都将为可信数据空间的长远发展注入信心。
来源:中国信息安全