摘要:在 “十四五” 数字经济发展规划深入实施、数据要素市场化配置加速推进的政策背景下,数据产业已成为驱动经济高质量发展的核心引擎。本篇内容梳理的浙江省9月以来新备案的数据产业项目10个。项目聚焦基础设施领域、垂直行业应用、技术攻关领域。项目详请如下:
(ICT标局工作台截图)
在 “十四五” 数字经济发展规划深入实施、数据要素市场化配置加速推进的政策背景下,数据产业已成为驱动经济高质量发展的核心引擎。本篇内容梳理的浙江省9月以来新备案的数据产业项目10个。项目聚焦基础设施领域、垂直行业应用、技术攻关领域。
项目详请如下:
浙江中科数据信息工程
项目名称:浙江中科数据信息工程
项目(法人)单位:浙江中科碳空间科技有限公司
总投资(万元):50000.00
项目类型:备案类(内资基本建设项目)
拟开工时间:2025 年 12 月
拟建成时间:2026 年 12 月
备案日期:2025 年 09 月 11 日
建设规模与建设内容:阳银湖中心机房建设;租赁高铁管廊(槽道)铺设信息化工程。配套辅助设施建设:新建光交箱 24 个(1152 芯),配套管道、电源、监控等设施。
影视文化数据产业发展服务平台
项目名称:影视文化数据产业发展服务平台
项目(法人)单位:东阳数据资源有限公司
总投资(万元):5000.00
项目类型:备案类(内资基本建设项目)
拟开工时间:2026 年 04 月
拟建成时间:2027 年 05 月
备案日期:2025 年 09 月 11 日
建设规模与建设内容:项目基于虚拟制作技术、生成式 AI 应用、多模态融合等关键技术,租赁 1800P 高性能国产化算力,汇聚 PB 级影视行业全产业链数据,面向 “创作、拍摄、后期、宣发” 影视产业全流程四大环节,搭建影视模型服务、语料共享服务、应用服务、影视数据安全中心 4 大服务为核心的开放产业服务平台,全面打造影视文化行业共性服务能力体系。项目围绕 “4+N” 建设架构,围绕算力、数据、模型三大人工智能基本要素,搭建影视模型服务平台、影视语料共享平台、场景应用服务平台、影视数据安全中心等 4 大服务平台,构建 N 个智能化应用场景,全面打造影视文化数据产业服务平台。
吴兴区数据产业共性基础设施建设与运营项目
项目名称:吴兴区数据产业共性基础设施建设与运营项目
项目(法人)单位:浙江数字吴兴技术运营有限公司
总投资(万元):80000.00
项目类型:备案类(内资基本建设项目)
拟开工时间:2025 年 10 月
拟建成时间:2028 年 09 月
备案日期:2025 年 09 月 09 日
建设规模与建设内容:为推动吴兴区数据产业高质量发展,项目以共性支撑能力为核心打造 “1+1+2+N” 体系。其中 “1” 个全域数据智能采集工程,涵盖智能感知工程与云设施升级,全域部署超 5 万个感知终端,通过统一网络在信创云汇聚数据,构建泛在、高速、安全、韧性的数字基础设施。“1” 个数据产业智能中枢,包含可信数据空间、共性能力平台和多源数据集成工程,集成数据、算法、组件、能力平台、智能装备等资源,实现一体化部署、共享协作与调度控制,形成线上线下联动、协同的共性支撑平台。“2” 大赋能中心,“人工智能 +” 赋能中心通过行业大模型、智能体提供数据应用创新服务能力;“数据要素 x” 运营中心提供数据开发、可信流通、资产运营等数据开发利用应用服务,从而建成支撑数据产业智能驱动与数据要素价值倍增的共性赋能与运营平台。N 个场景,涵盖城市治理、企业服务、产业发展、便民服务等领域,落地基层社会风险防控、城市微单元治理服务和数据金融等场景,通过跨层级数据共享、能力组件调度、多元主体协作三大机制,支撑数据应用场景的多元创新。项目建成后将引进数据企业超 50 家、孵化数据产品 2000 多个,数据市场交易量增长 25%,为全国中小城市提供 “可信流通、产业集聚、场景创新” 三位一体的数字化转型范式。
基于大模型高阶程序的数据治理和应用技术攻关项目
项目名称:基于大模型高阶程序的数据治理和应用技术攻关项目
项目(法人)单位:浙江蚂蚁密算科技有限公司
总投资(万元):6000.00
项目类型:备案类(内资基本建设项目)
拟开工时间:2026 年 01 月
拟建成时间:2027 年 12 月
备案日期:2025 年 09 月 08 日
建设规模与建设内容:本项目总投资 6000 万元,面向高质量数据集建设和数据要素深度赋能实体经济场景,依托大模型驱动的高阶程序、密态计算等关键技术,构建自动化的数据治理平台、高可靠的数据应用服务。项目建成后,将提升人工智能技术的可靠性至 99.7% 以上,突破大模型专业领域应用的误差容忍拐点,推动人工智能从通用智力迈向专业生产力,全面赋能数据要素化价值化的各个环节。本项目应用前景广阔,可以承担几乎所有行业数字化的初级工作,显著提升全国各地区、各行业高质量数据集建设的自动化能力,弥补数据要素市场建设中巨大的劳动力缺口。同时,赋能医疗、政务、法律、金融等对数据与大模型可靠性有高要求的场景,加速新质生产力发展。针对高质量数据集建设中自动化水平不足、数据缺乏治理等难题,本项目将应用大模型驱动的高阶程序重构数据治理和数据服务,重点围绕大模型驱动的高阶程序开展技术攻关,包括构建高阶程序框架,逻辑判别、核验等关键算子,以及数据治理、数据应用等场景相关的算法库。本项目聚焦将大模型幻觉率降低至原来的 1/3 以下,以及将数据治理错误率降低至原来的 1/3 以下、数据治理人工工作量降低至原来的 1/10 以下、支持每天亿级数据处理等目标,计划部署 40 台 8 卡 GPU 服务器、10 台 CPU 服务器。项目建成后,将大幅提升数据行业的自动化水平,支持至少 5 个区域、10 个行业、20 个场景的数据治理与数据应用,助力区域和行业数字经济转型升级。
低空城市安全巡检高质量数据集建设项目
项目名称:低空城市安全巡检高质量数据集建设项目
项目(法人)单位:杭州鲁尔物联科技有限公司
总投资(万元):7010.00
项目类型:备案类(内资技术改造项目)
拟开工时间:2025 年 12 月
拟建成时间:2027 年 12 月
备案日期:2025 年 09 月 08 日
建设规模与建设内容:建设内容主要包括:一是构建 “天空地” 多源数据采集体系,以低空无人机为核心载体,搭载多光谱相机等设备,结合遥感数据和地面传感器,形成立体感知网络,采集生态环境、基础设施、自然资源领域的多模态数据;二是建设自主化数据处理体系,通过自动化预处理、“AI 预标注 + 专家复核 + 交叉验证” 的标注模式及垂域大模型数据验证,形成带四维标签的标准化数据集;三是打造可信数据空间,整合加密存储、权限分级等技术,实现数据全生命周期安全管理与跨部门协同共享;四是开展场景应用验证,在生态环境、基础设施、自然资源领域应用数据集及垂域大模型,实现污染识别、设施评估、灾害预警等;五是建立全链条标准规范与安全保障体系,制定 3 项核心标准,明确多方权责及收益分配等机制;同时拟建设原始数据集、校正数据集及 AI 模型产品等低空城市安全巡检卫士高质量数据集产品。
吉利星睿高质量数据集基础能力建设及关键技术攻关项目
项目名称:吉利星睿高质量数据集基础能力建设及关键技术攻关项目
项目(法人)单位:吉利汽车研究院(宁波)有限公司
总投资(万元):20000.00
项目类型:备案类(内资基本建设项目)
拟开工时间:2025 年 09 月
拟建成时间:2027 年 09 月
备案日期:2025 年 09 月 10 日
建设规模与建设内容:本项目围绕智能驾驶、智能网联、生态产品研发等核心业务场景,重点开展跨领域、多模态的行业高质量数据集体系建设,针对当前跨领域、多模态数据存在的语义割裂和高质量数据稀缺等关键问题,项目重点攻关数据自动化治理技术,提升数据清洗、标注、质量评估的智能化水平;突破多模态数据语义对齐技术,实现车联网信号数据、语音数据、视觉数据、非结构化文本等多源异构数据的深度融合与统一表征;发展复杂场景下的仿真数据合成技术,构建高保真、可配置的车辆仿真数据集,增强智能驾驶系统在长尾场景中的训练与验证能力;同时优化高效数据准备流程,提升数据从采集到服务的全链路处理效率。基于攻关结果,系统性提升车联网领域数据集的质量、规模与可用性,重点建设智能驾驶数据集、多模态非结构数据集、人工智能语音数据集、车联网信号数据集、车辆仿真数据集及生态产品数据集等核心数据资产。所建数据集将全面支撑智能化场景研发、产品质量追溯并协同与生态链创新应用,推动数据驱动业务模式的落地。预计到 2026 年,数据规模将超过百 TB 级别,终端用户规模数 500 万以上,覆盖至少 10 家产业链相关组织和企业。
文广旅行业高质量数据集建设与技术攻关项目
项目名称:文广旅行业高质量数据集建设与技术攻关项目
项目(法人)单位:华数传媒网络有限公司
总投资(万元):10000.00
项目类型:备案类(内资基本建设项目)
拟开工时间:2025 年 09 月
拟建成时间:2027 年 09 月
备案日期:2025 年 09 月 05 日
建设规模与建设内容:项目以华数传媒在文旅行业的应用实践为基础,构建文旅行业数据资源汇聚平台并攻关高质量数据集开发关键技术,面向文旅行业 5 个应用场景,汇聚跨区域、跨层级、跨机构的行业数据资源,构建一批多模态、大规模、高知识密度的行业高质量数据集,助力文旅行业向 “数据驱动、智能升级” 转型。具体建设内容如下:(1)数据集基础设施建设:以 “中心 + 边缘” 分布式架构建设数据存储集群和应用算力集群设施,支撑文旅行业高质量数据集全周期流程建设;构建文旅行业数据专网,支撑跨区域、跨层级、跨机构的行业数据采集与交换。(2)文旅行业数据资源汇聚平台开发:以平台建设支撑面向文旅行业多模态数据的采集、存储、标准化、清洗、标注、质检、运营管理及对外服务能力。(3)行业高质量数据集开发:面向景区及文化场馆精细化运营、政府智慧化监管、游客个性化服务、文化遗产数字化保护与传承、文旅内容创新性传播等 5 大应用场景开发行业高质量数据集。(4)数据集开发核心技术攻关:攻关数据自动化治理、多模态数据语义对齐、复杂场景仿真数据合成、高效数据准备等数据集开发技术。
面向金融行业大模型的多模态高质量数据集建设
项目名称:面向金融行业大模型的多模态高质量数据集建设
项目(法人)单位:恒生电子股份有限公司
项目类型:备案类(内资基本建设项目)
拟开工时间:2025 年 09 月
拟建成时间:2027 年 08 月
备案日期:2025 年 09 月 05 日
建设规模与建设内容:项目拟用两年时间,总投资 12000 万,购置 30 台高性能交换机,100 台服务器等,建设面向金融大模型应用的链接数据库 AIDB,构建多模态高质量数据集,在证券、基金、银行等 60 家单位进行示范应用,进而推广至全行业。项目针对金融领域大模型数据质量不高、可解释性低和落地应用难等问题,围绕高质量行业语料和标准结构化数据集、链接数据库、指令微调数据集和测试集等三大建设方向,应用大数据离线计算、实时计算等技术,融合数据集成与同步、元数据管理、数据质量管理等维度,探索与实践面向金融大模型应用的链接数据库 AIDB,构建多模态高质量数据集。项目将建设数据子集不低于 2000 个,链接数据库指标集不低于 20000 个,微调集超过 100 万条问答对,开放高质量数据集 400 个,应用于不少于 60 家行业机构。
语料关键核心技术攻关项目 - 方向 4:语料数据处理技术攻关
项目名称:语料关键核心技术攻关项目 - 方向 4:语料数据处理技术攻关
项目(法人)单位:杭州景联文科技有限公司
项目类型:备案类(内资基本建设项目)
拟开工时间:2025 年 09 月
拟建成时间:2026 年 12 月
备案日期:2025 年 09 月 05 日
建设规模与建设内容:以中文语料为主要对象,研发具有自主知识产权的先进中文语料预处理、标注、质检、增强、封装全流程技术工具链。加工方面,打造高效率、高质量、智能化的多模态中文语料处理加工工具,实现文本 - 音频 - 视频的跨模态对齐和融合标注;数据安全方面,打造防毒害 / 偏见 / 后门 / 注入 / 越狱等主要数据污染检测技术工具,实现高精细度的语料价值观对齐,确保语料内容合规;数据增强方面,打造针对目标需求的智能重述技术工具等。到 2026 年底,预计打造上述完整技术工具链条并开源发布,形成 10 项自有知识产权语料处理技术成果,支撑打造至少 6 类、总数不少于 5 个、总规模至少 1PB 的中文语料集,高质量数据比例不低于 90%,赋能形成不少于 10 个行业典型应用案例,在下游应用性能提升超过 5%。
数据安全流通技术攻关项目
项目名称:数据安全流通技术攻关项目
项目(法人)单位:瓴羊智能科技有限公司
项目类型:备案类(内资技术改造项目)
拟开工时间:2025 年 12 月
拟建成时间:2026 年 12 月
备案日期:2025 年 09 月 02 日
建设规模与建设内容:瓴羊是阿里巴巴全资子公司,由阿里巴巴集团数据中台、业务中台、客服系统、供应链服务等多个部门在 2021 年融合升级而来,作为数字化行业的领头羊,瓴羊高度重视数据要素流通市场,并在数据流通技术 & 产品等方面做了大量的投资,瓴羊港是瓴羊独立建设的数据流通平台,旨在建设从治理、流通、使用的全链路基础设施平台。项目自主研发隐私计算技术(Data trust)、应用区块链存证,并构建数据开发平台、AI 模型开发及训练平台;实现数据治理、上架、流通、消费及安全合规的全链路服务。该项目技术全面国产化,支持 SM3、SM4 等加密协议,达梦、人大金仓等数据库;银河麒麟、统信等操作系统;阿里云 OSS、东方通等中间件。数据流通相关核心技术优势:・隐私计算:瓴羊隐私计算产品提供中心化和去中心化两种模式,以成熟的同态加密、差分隐私、隐私集合求交、安全多方计算等技术提供 ID 安全匹配、隐匿信息查询、安全联邦学习、安全联合分析等隐私计算能力。・数据处理:瓴羊目前自主研发百余算子,对数据集进行质检和加工,实现文本、图片、音频、视频的自动化质检加工打标,快速应用至模型训练。・高质量语料生产技术创新:瓴羊具备高质量语料生产技术创新能力,覆盖面包括针对推理数据、具身智能、多模态语料。・MaaS:瓴羊基于自研及行业主流大模型,提供模型托管、API 调用、定制微调、在线推理等一站式服务,支持多场景、低延迟、高并发的 AI 能力输出。数据采集:具备丰富的数据采集能力,依托友盟产品实现移动端数据采集应用。截止到 2026 年底,支持不少于 10 万条数据流通记录溯源;不少于 1 万级用户安全策略管理;实现数据加密与数字身份认证机制,实现数据加密传输成功率不低于 99.99%、身份认证延迟不高于 100ms;智能合约支持不少于 5000 条,成功率不低于 99.99%;系统支持不少于 1000 万次并发数据调用访问,平均调用响应时间不高于 50ms;完成不少于 10 类典型数据跨域流通场景。实现 5 个训练场之间以及训练场与模型企业之间数据安全流通环境建设。
来源:ICT标局