摘要:随着科技革命和产业变革深入发展,智算中心作为支撑数字经济与科技创新的新型基础设施,在经济社会高质量发展过程中发挥着重要作用。2023年12月,国家发改委等四部门发布《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,文件首次提及“算力电力协同”
该项目案例由商汤科技投递并参与数智猿×数据猿×上海大数据联盟共同推出的#技术向善·榜样的力量#《2025中国数智产业最具社会责任感企业》榜单/奖项评选。
随着科技革命和产业变革深入发展,智算中心作为支撑数字经济与科技创新的新型基础设施,在经济社会高质量发展过程中发挥着重要作用。2023年12月,国家发改委等四部门发布《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,文件首次提及“算力电力协同”概念,并将创新算力电力协同机制列为重点任务。
算力作为数智时代的新质生产力,是推动数字经济发展的重要引擎,电力作为算力发展的重要基础资源,深刻影响着算力发展的规模和成本。人工智能是算力爆发性增长的主要驱动力,未来随着人工智能广泛应用算力需求将不断攀升。中根据国际能源署(IEA)相关数据显示,全球数据中心、人工智能等相关电力需求将从2022年的460太瓦时上升至2026年的620—1050太瓦时。根据国家数据局统计,截至2024年末,我国在用算力中心标准机架数超过 900万架,算力规模达到280EFLOPS,算力总规模较2023年末增长16.5%。
随着芯片架构性能的不断提升,功耗的增加也变得尤为显著。为应对芯片功耗增加带来的问题并保证算力能够高效且大规模地运行,两个关键因素是高性能芯片和稳定的电力供应。算力中心的本质在于将电力转化为算力,也就是将瓦特转换为比特,这一过程是数字经济发展的基础。因此,如何提高数据中心的能效,减少能耗,成为行业发展的关键问题。
在数字经济发展和“碳中和”目标任务的双重驱动下,通过“算力赋能电力系统智能化转型,电力带动算力绿色化升级”的双向路径,建立算力与电力“同频呼吸、融合共生”的发展模式,是实现智能基础设施绿色转型的关键举措。
时间周期:
开始时间:2025年2月
截止时间:2025年12月
服务周期:服务中
应用场景
算电协同平台在全国首个5A级智算中心“商汤临港智算中心”落地,通过构建人工智能与能源深度融合的智能基础设施,推动临港AIDC迈向“低成本、高效能、可持续”的新阶段,并为AI基础设施绿色化升级提供可落地、可复制、可推广的解决方案。
商汤的算电协同的实践路径,是在核心算法能力和商汤科技超大规模算力集群长周期高质量训练数据的支撑下,将能源大模型技术、算力调度技术与新型储能技术相结合,推动用户侧大规模算力应用场景与发电侧新型电力系统用能模式的协同创新。
商汤通过打造「数据—算法—策略—执行—验证」的全链条智能调度系统,实现算力与电力的双向耦合,实现“电随算动”,提高电力系统对算力负荷的响应与优化能力,最终实现算力与能源的精准匹配与高效利用。
面临挑战
目前算力电力双向协同面临资源分配、技术兼容性和成本控制等方面仍存在挑战。如何合理分配计算资源和电力资源,以满足不同应用场景的需求,不同硬件和软件平台之间的兼容性问题,可能影响协同效率。此外,随着算力和电力的协同,数据和能源的安全性问题变得更加突出,算力电力协同带来成本的增加,需要考虑经济效益。
电力需要在算力巨量增加的背景下动态、适时规划稳定供给和绿色的目标,两者之间是动态平衡的,不是电力单向适配的关系。发电预测、电力电量平衡、大范围跨时空资源配置、长周期规模化储能等技术提出更高要求。
因此算电协同需要进一步从资源、调度、运营到流通的全方位算电协同创新。依托园区能耗管理、储能及工商业储能以及虚拟电厂等技术推进绿色电力与算力联合调度是其中重要一环。为充分发挥算力中心灵活调节特性,推动算力中心向新型电力系统主动支撑者转变,需加强电力与算力联合调度,使算力负荷特性与可再生能源出力特性相匹配,从而促进可再生能源消纳,保障电网运行安全。具体而言,算力中心可调负荷可通过直接参与、负荷聚合商参与等形式参加不同时间尺度的电力需求响应,从中获得价格补偿。同时,算力中心可参加绿电、绿证交易,支撑自身绿色低碳转型。
技术开发过程
商汤算电一体化协同方案以商汤临港智算中心万卡规模集群为落地场景。整体方案主要涵盖三个层面:基础设施层、能力支撑层和业务管理层,以实际算力与电力运营数据为基础支撑,完成能源大模型与算力调度大模型的研发,通过打造算电协同管理平台,形成对算电一体化协同方案的支撑。该方案基于业务运营需求,通过对算力趋势和用电需求的精准预测,实现对算力资源与电力资源的高效协同管理,最大化智算中心的算效与能效。
算力基础设施
基础设施层通过对供配电系统、温控系统及IT系统的监控等,汇集算力基础设施的状态数据、电力数据、算力数据和其他系统数据等底层数据。通过数据中台对这些基础数据进行采集管理、清洗加工和标准化等数据预处理,从而更好的利用这些数据进行能源大模型的调优,并最终纳入算电协同的业务管理闭环。
能源大模型体系
商汤基于自研“日日新”大模型与生态企业合作打造能源大模型体系,针对各类能源场景稠如能源调度、交易、运营等,整合算力预测模型、算力任务调度模型、异构资源调度模型、性能优化调度模型、用电负荷预测模型、气象大模型、电力市场化交易模型等等,对算力的应用场景进行负载率和电力需求量的趋势预测,以实现更精准的能耗管理。
商汤能源大模型体系通过深度学习、大数据分析等先进算法,能够在TB级数据支撑下,对电力系统进行精准建模,使得大模型能够捕捉系统中多种变量之间的复杂关联。在保证基础通识能力的同时,该模型体系能够通过预测、决策、调度,处理复杂的能源任务,是能源行业内首个具备“分析、优化、决策、交互”等多种能力的全栈式大模型,可以满足行业客户的不同场景需求。商汤能源大模型通过边端能量控制器感知源网荷储资源信息,以节点“能量块”数据结构为基本单元,通过预测下一个15分钟的“能量块”数据,生成自适应的“能量系统”,针对能源场景提供分析与决策能力,并通过算电协同平台进行能源调度。调度过程中支持人为评估与策略调整,调度完成后自动进行策略校验,所有人为调整和校验结果将被反馈至大模型,以实现模型性能的持续调优。
商汤算电一体化协同方案中,实现业务管理最终应用落地的产品形态是算电协同管理平台。该平台基于商汤能源大模型体系的能力支撑而打造,通过精细化采集能源与算力运营数据,实现智算中心数字化、可视化、智能化管理,充分掌握能源效率、算力效率、经济效益、环境影响、系统稳定性与可调节性等关键数据,并支持对智算中心的算力趋势和用电负荷精准预测及调度。
通过算电协同管理平台,实现算力赋能电力、电力保障算力的双向促进,构建了算力与能源之间的关联模型,仅能降低算力服务成本,提升算力运行效率,还能实现算力和电力资源的深度融合与高效协同,以支持新型基础设施和新型电力系统的协同发展,实现联网调度、普惠易用、绿色安全的目标。
算力管理
在算力管理方面,算电协同管理平台支持对算力总资源、实时算力、可用算力、训练与推理任务进行监控与管理,帮助算力运营团队实现算力趋势预测,提供精细化、跨区域算力调度与运营和精准用能策略,提升整体算力效率与运营收益。
电力管理
在电力管理方面,基于算电协同管理平台对用电量、实时用电负荷、可调节负荷、PUE等关键指标进行监控和预测,利用能源大模型在源、网、荷、储侧推进一体化管理监控、电力调度和效率优化,降低电力成本与系统风险。
训推一体架构大幅提升计算利用效率
智算中心的训练任务具有非常大的波动性,且不规律,需求时间段不稳定;而推理任务有规律,需求时间段稳定。如果按传统的训、推分离模式,那么计算资源将大量闲置。为此,商汤在行业内率先引入了更加灵活的“训推一体"调度架构,通过动态调度、离线推理、后台微调、断点续训、削峰填谷等算力调度优化策略,最大程度地提高算效CUE稠Compute Utilization Efficiency,计算利用效率,即单位能耗下的算力输出能力,,极大减少资源的闲置和浪费,将单MW 电力产出的有效算力从行业均值200P大幅提升至350P。此外,在推理场景中,商汤实现了在相同算力及电力成本下的每秒请求数稠QPS,4倍的大幅提升,并实现了推理服务弹性按需伸缩,优化了大规模AI推理的整体成本。
电算能源大模型实现更精准能耗管理
在PUE(Power Usage Effectiveness,电源使用效率)能效优化方面,商汤不仅通过调整暖通运行策略等方式降低能源消耗,还基于“日日新”大模型打造能源大模型体系,对算力的应用场景进行负载率和电力需求量的趋势预测,结合设施系统配置,生成设施运行策略,通过精确用能,实现智算中心的运行优化与节能降耗。同时,商汤构建了全生命周期标准化运维管理体系,研发了运维大模型与AI智能运维管理平台。
作为算电协同的关键抓手,源网荷储一体化运营通过整合电源侧、电网侧、负荷侧资源要素,使用储能等技术,通过高效、智能、精准的运营管理,实现电力生产和消费体系的革新。在发电侧,通过合理选址,结合气象预测,通过能源大模型实现电力市场变化趋势的综合预测,通过交易等形式对接清洁能源,生成组合式调度与交易策略,降低电力成本,提升清洁能源利用比例。在用户侧,进行精准用电负荷的用能管理,并提高算力负荷预测的准确性,建立了算力与电力之间的数据穿透,加强电力与算力联合调度,使算力负荷特性与可再生能源出力特性相匹配,促进可再生能源消纳,保障电网运行安全。
自研能源大模型联合智慧运维,全年节电300万度。商汤大装置基于海量行业知识文本、能源结构化数据、算力监控指标等数据训练,并结合能源行业知识库形成LM+Agent 能源大模型体系,显著提高模型专业性与领域适用性。通过能源大模型结合现场智慧运维开展各项节能工作,年度PUE优化至1.28以内,实现全年节约用电300万度。
创新“能量块”算法架构,让复杂场景预测更精准。通过将能源本征数据、用户用能特性、能源平衡规则等信息与算力服务器绑定为“能量块”作为基础TOKEN,并基于多轮预训练结果优化调整算法架构,可全面提升复杂场景下的预测精度与泛化能力。
采用15分钟高频次动态调度,实现最优能源平衡。平台以15分钟为周期进行高频次预测,并以5分钟为周期进行决策修正迭代,基于实时能源状态与负载预测,自动生成最优调度策略,并通过跨系统联动执行,实现精准的算力预测、负荷预测、策略生成与修正。
目前,基于能量块的模型能源需求预测准确率已经达到88%以上,决策准确率已达到93%以上,预计在年内随着算法与储能设备的持续迭代优化,预测准确率将达到90%-95%的行业领先水平,决策准确率95%+。
应用效果/社会价值
随着人工智能应用爆发式增长,算力需求迅猛增加,已成为推动产业绿色化转型发展新的关键生产力。随着智算中心的高功耗和高散热要求,其运营成本不断上升,推动智算中心的绿色发展变得迫切。算力与电力的强耦合关系,决定了电力能耗成为制约算力设施建设、推动产业数智化转型的关键因素。算电协同指依托计算能力和电力供应之间的协同发展,旨在优化计算资源的能源效率和可持续性。
根据IDC数据,国家计算力指数与GDP/数字经济的走势呈现出了显著的正相关,十五个重点国家的计算力指数平均每提高1点,国家的数字经济和GDP将分别增长3.5‰和1.8‰。此外,算力供给创造巨大的经济价值,将释放数字经济发展潜能,推动数字经济产业布局优化、提升产业效率;促进区域数据流通、价值传递;延展区域发展空间,推进区域协同形成新格局。
关于企业
·商汤科技
作为人工智能软件公司,商汤科技以“坚持原创,让AI引领人类进步”为使命,旨在持续引领人工智能前沿研究,持续打造更具拓展性更普惠的人工智能软件平台,推动经济、社会和人类的发展。
商汤科技拥有深厚的学术积累,并长期投入于原创技术研究,不断增强行业领先的多模态、多任务通用人工智能能力,涵盖感知智能、自然语言处理、决策智能、智能内容生成等关键技术领域,同时包含AI芯片、AI传感器及AI算力基础设施在内的关键能力。
★以上由商汤科技投递申报的项目案例,最终将会角逐由数智猿×数据猿×上海大数据联盟联合推出的#技术向善·榜样的力量#《2025中国数智产业最具社会责任感企业》榜单/奖项。
来源:新浪财经