全国首批!苏州企业再添“硬核”成果

B站影视 日本电影 2025-09-03 14:49 1

摘要:在8月28日至30日召开的2025数博会上,国家数据局正式发布首批104个高质量数据集典型案例名单。苏州高新区企业中国移动云能力中心报送的“研发大模型高质量数据集”案例,凭借其在数据构建、治理与应用等方面的突出成果,成功入选“高质量数据集典型案例”,是全市唯一

近日

苏州高新区数字经济发展

再添两项“硬核”成果

在8月28日至30日召开的2025数博会上,国家数据局正式发布首批104个高质量数据集典型案例名单。苏州高新区企业中国移动云能力中心报送的“研发大模型高质量数据集”案例,凭借其在数据构建、治理与应用等方面的突出成果,成功入选“高质量数据集典型案例”,是全市唯一入选案例。

在国内两大权威安全机构——中国信息安全测评中心、国家保密科技测评中心联合发布的安全可靠测评结果公告中,中国移动云能力中心开发的“大云海山数据库”(技术名:He3DB for PostgreSQL V2.0)获评最高等级“Ⅰ级”认证,成为国内电信运营商里,首款通过“安全可靠测评”的数据库产品。

研发大模型高质量数据集

在人工智能大模型加速渗透各行业的背景下,代码数据质量和动态利用方式是大模型推理能力的核心支撑,在软件工程等领域意义重大。

针对当前代码数据来源广、质量参差、评估专业度不足等问题,中国移动云能力中心构建“数据采集-数据处理-数据质量评估”高质量数据处理引擎,形成研发大模型数据集,并据此训练出具备代码补全、单元测试等能力的研发大模型,体现了三大核心创新

在技术层面,研发大模型团队通过多元规则体系与大小模型协同技术,完成代码数据去重、脱敏、场景化标注,将原始数据转化为可应用的高质量数据;

△研发大模型高质量数据集架构图

在流程层面,打造专门面向代码数据的采集、处理、训练等全流程闭环质量优化体系,结合规则阈值和大模型测评,实现模型加数据飞轮良性循环;

在机制层面,构建了数据安全合规审查体系和数据资产共建共享办法,形成产业生态闭环,保障数据全生命周期安全,推动价值最大化。

项目负责人介绍,该数据集沉淀超50+核心算子,自动化率达90%,支持处理1500万文档/小时,建立覆盖12个核心维度的数据质量评估体系,实现数据全方位质量提升。

大云海山数据库

作为支撑数字社会运行的核心基础设施,数据库的安全可靠性直接关系到政务服务、民生保障、产业升级等关键领域的稳定运转。

“大云海山数据库”凭借五大核心优势破解行业痛点,为千行百业数字化转型提供坚实支撑:

高扩展:面对业务规模快速增长需求,可灵活实现“扩容升级”,无需重构系统架构,大幅降低企业数字化改造成本;

高性能:数据处理效率处于行业领先水平,在医院病历调取、学校学籍查询、政务数据统计等场景中,能有效避免卡顿延迟,提升服务响应速度;

高可用:具备极强的故障容错与快速恢复能力,即便出现突发问题也能迅速切换备用机制,保障党政机关、医疗机构等关键单位业务“不中断”;

高安全:构建了全链路数据防护体系,能有效抵御数据泄露、篡改等风险,完全满足政府、医疗等行业对信息保密的严苛标准;

低成本:相比同业同类产品,在保持核心性能优势的同时,显著降低企业采购与运维成本,助力中小微企业轻松拥抱数字化。

此外,“大云海山数据库”与主流国产芯片、操作系统全面“兼容”,摆脱对国外技术的依赖,真正做到 “自主可控”,为业界提供即开即用、安全可靠的数据库服务,充分彰显了高新区企业在国产基础软件领域的领航实力。

目前,该数据库已在党政、教育、医疗等行业项目中稳定运行,业务覆盖26个省份,打造了多个重点标杆,充分发挥央企领航作用,为千行百业赋能。

落户苏州高新区以来,中国移动云能力中心坚定围绕成为世界“一流云服务商”的目标,矢志扮好算力服务提供者、行业数字化赋能者、算力技术创新引领者角色,做大数字服务规模,助力数字中国发展。

来源:引力播新闻

相关推荐