对谈纪实|AI时代的能耗挑战:算力的尽头是能源

B站影视 2024-12-13 09:03 2

摘要:10月19日上午,由文汇讲堂和北大博雅讲坛联合承办,上海市算力网络协会、北京大学出版社、上海图书馆联合主办的“展望下一代算力暨《对话时代》新书研讨讲座上海场”在上图东馆成功举办,近10万人次观看直播。主讲嘉宾为上海超级计算中心主任李根国,对话嘉宾为上海超级计算

【导读】10月19日上午,由文汇讲堂和北大博雅讲坛联合承办,上海市算力网络协会、北京大学出版社、上海图书馆联合主办的“展望下一代算力暨《对话时代》新书研讨讲座上海场”在上图东馆成功举办,近10万人次观看直播。主讲嘉宾为上海超级计算中心主任李根国,对话嘉宾为上海超级计算中心高性能计算部部长王涛、商汤科技大装置事业群生态执行总监刘远辉,主持圆桌环节的上海市算力网络协会专家会员沈巍。

经整理,主讲篇已刊发,此为对话篇。

上海市算力网络协会三位专家沈巍、刘远辉、王涛在李根国主讲后进一步展开探讨

沈巍:上海市算力网络协会成立于2022年9月,是全国首个聚焦算力网络领域的专业协会,目前已有100多家成员单位。我们的愿景是拉通算力网络的供需两端,使得未来的算力能像电力、自来水一样,让每个用户都能非常方便的使用,将算力的绿色化、高效化、智能化赋能每一个行业。今天和理事长单位上海超算中心等一起和大家探讨下一代AI算力,也是协会的社会责任。

日常工作和生活背后的AI运行

先请两位专家分享和揭秘,日常工作和生活中使用的AI场景,背后是哪些基础设施在支撑其运行。

*金融各个领域从信用评估到风险管理都用大模型

刘远辉:关于算力需求的问题,本质上就是AI大模型在生活、科研等场景下如何被应用的问题。

我的工作从IBM到华为,再到商汤科技公司,经历了计算机发展的不同时代。大型机时代经过30多年被小型机淘汰,小型机时代经过十几年进入云的时代,后又进入大模型出现称为的AI1.0时代,2022年openAI发布chatGP后,TITD(数据中心)发布《2022中国大模型发展白皮书》标志着进入大模型2.0时代。

刘远辉三段工作履历见证了计算机的发展各阶段

我从事了很多关于金融数字化的研究。当下,大模型已被广泛应用于信用评分、风险管理、高频交易和客户服务等多个方面。比如信用评分,大模型可以分析借款人的历史交易、社交媒体活动,评估信用风险,提高贷款审批的速度和准确性。比如风险管理,借助AI大模型技术分析时事新闻报道、财报和社交媒体,识别可能影响市场或特定资产的突发事件,使金融机构能够快速调整策略,以及应对潜在风险,但这个功能需要巨大的算力,需要GPU(图形处理器)、HOUR(HOUR函数)、TPO(市场轮廓图)计算小时时差。

大语言模型在准确性和精准计算上还有很大空间,但金融领域的应用无论是信贷还是材料分析,都需要严谨。而且金融需要严监管,这是对AI的考验。但是初期也积极拥抱大模型,在边缘业务、推荐业务上有了一定的成果,近期之内会有大量的应用进入金融领域。

由此看出,大模型的迭代时间在不断缩短,我们要有耐心,相信大模型在未来几年内就会取得更大的成果。

*由AI支撑的微短剧年收入接近400亿,有望超电影业

微短剧在爱奇艺平台颇受欢迎,通常38元看全集

同时,我观察到AI在新兴领域的应用。例如微短剧行业可以是大模型原生的一个方向,AI现在已经应用于许多微短剧中。据市场统计,2023年中国电影票房约560亿,同期微短剧的收入将近400亿,预计2027年微短剧的市场可能会达到1000亿,一两年之内就超过了电影票房市场。

微短剧的商业模式与AI密切相关,其制作周期大约只需几周,甚至几天。微短剧使用的文本可以由AI代写。像当下比较热门的文生视频大模型,未来也可用来制作微短剧。

*超算中心运作两套算力系统:超算算力与AI算力

王涛:我从事超算行业已有20多年。上海超算中心不是一个科研机构,而是一个应用和推广超级计算机的平台,它成立于2000年,是国内第一家面向公众开放的超算平台,主要工作是让大家用好超级计算机,改善公众的生活,促进科学发现。工作人员大多是应用学科方向。

超级计算中心是提供算力的一个主要机构,我们目前有两套具有不同应用特点的系统,一套是用来做传统的模拟仿真类的计算,是传统意义上的通用型超级计算机,名字叫“魔方三号”,大约有将近36000个CPU核。另一套是用华为系统做的人工智能平台,大约提供了100P的16位浮点算力(FP16)的计算能力。

上海超算中心其实并不神秘,可以预约参观

*人工智能如何帮助药物研发缩短几十倍的时间

人工智能在基础科学方面更好地体现了辅助工具的作用。举个例子,我们正在设计一款化学反应的催化剂,按照传统的研发流程,第一步是思考怎样的催化剂能与反应物结合,让它变得能量更低。做设计时可以利用计算机计算分子结构,推算出能否合成这样的分子。设计结果出来后再与反应物进行计算,测试它能否结合成一个稳定的结构并降低能量。从最初设计分子之时起,我们就要穷举各种可能性,每种都要计算一遍,可能要算1000次、10000次,计算机需要几个月时间。但这至少比做实验快多了,因为通过实验合成每一个分子需要较长时间,若要合成1000次、10000次,可能几年都完不成。

人工智能的出现告诉我们,最初猜想的那几千个分子无须全部计算,只需要计算其中的10%。当然人工智能还有许多不确定性,它提供的是一个概率性的答案。它会把最初列举穷尽的几千种情况减少至几十个,此时再进行计算只需几天。计算完毕后再进行实验验证。

王涛详尽介绍AI如何参与催化剂设计发挥巨大作用

无论是药物设计还是交通工具设计,整个人类的研发逻辑都是如此,先穷举无限的可能性,再逐步缩小。在这方面,人工智能工具可以极大加快研发过程。

*冰箱2度电,机柜200度电,AI算力机柜1500度电

沈巍:进入算力中心看到的是一排排的机柜,机柜里密集地摆放着服务器,可以把服务器机架想象成数字世界的书架。上海图书馆的书籍约有5700万册,全部摆放到书架上大约需要10万个书架。如果将这些书全部数字化变成数据后,大约只需100个存储机柜就能存储。

截止2023年底,上海数据中心的服务器机架约有20万个。截止2024年6月,国家工信部发布的数据显示,全国已有830万个数据中心的标准机架,这是中国现有算力设施的总体量,是一个非常庞大的基础设施。互联网的应用、人工智能的应用,以及未来的应用都基于这些基础设施的更新迭代和升级。

沈巍善于将抽象事物形象化比较

数据中心的机架更像一个能源怪兽,以与家中双门电冰箱尺寸一样大小的机柜来比较。电冰箱一天约耗1-2度电;10年前数据中心的一个机柜一天约耗电100-200度;今天算力中心为 AI服务的算力机柜,一天耗电1500度;要去做一个大模型的运算,最起码要500到上千个机柜同时去运行。GDP-4是用了三个月的时间训练。这样大家能较直观地理解能源怪兽的需求。

AI正在被广泛应用于各行各业。如果明年再开一场论坛,可能就是三个AI坐在现场给大家分享它们的超能力了。事实上,网络上已出现许多数字人带货,它不仅可以面向国内受众,也能够接待国外受众。AI生成的数字人不仅可以运用英语、还可以熟练运用阿拉伯语、马拉西亚语等任何小众语言。

如何应对AI带来的算力挑战

北大出版社、上海市算力网络协会等主办方承办与嘉宾合影

AI的发展具体面临哪些挑战?我们有哪些应对措施?

*AI强烈依赖未知的全要素数据,三维数据是方向

刘远辉:说到算力挑战,绕不开AI三大核心要素的算法、数据和算力一起协同考虑。

算法。大模型现在已进入新一代的算法,之前谈到的AI的准确性、对算力的需求等,其实底层就是Transformer模型,是一种基于自注意力机制(Self=Attention,Mechanism)的深度学习架构。

下一代架构是什么?以认识香蕉为例,父母告诉我们这是香蕉,我们就知道了。从技术层面来说,样本数是十几张甚至几张,而大模型就需要几千张甚至几万张进行训练,有时还会出现错误,这是算法的问题。大脑自带的生物电需要多少算力才能达到一个计算机的水平?核心是什么?可能就是大脑本身的算法问题。

数据。超算和智算最大的区别是什么?就是人工智能强烈依赖一个全要素数据。什么是全要素数据?实际上AI算法过程中也不知道哪些数据起了作用,得把所有的要素列出来才能达成效果,这也是现在在攻坚的AI黑盒难题。

李飞飞在自传《我看见的世界》里畅想了空间智能

2009年6月,被称为“AI教母”的李飞飞发布世界上最大的图像标记数据集ImageNet。现在她做的是空间智能,把数据做成了一个三维的数据,并且落地使用。这个方向就是人工智能机器人。问题是机器人如何理解场景?举例来说,如果使用家用机器人,你的家就是一个场景,里面由各种数据组成。如何让机器人使用洗衣机洗衣、扫地拖地,构建场景的底层逻辑就是数据。这其中的数据量有多大,目前还无法想象。

*新算力:核聚变沉淀、生物芯片、手机算力分布式集中

算力。大模型对算力的需要有多大?商汤科技的计算中心,用电量从2022年底的不足2000p到现在大约15000p,并且还在增长。每年用电超过1亿度。2023年,中国内地用电量百强城市排名中,遵义排在第100位,用电量大约230多亿度。也就是说,一个计算中心可能占1%,甚至抵得上一个小城市的用电量了。

最终要落到能源需求。上海有科研机构在从事核电研究,就是小太阳核聚变的沉淀。亚马逊、Google等公司都在投资核电,以后的算力就会朝能源方向发展。二是生物芯片、量子芯片,这是下一代发展方向。例如,人类的大脑在这么少一点电的情况下,如何能计算出这么大的量?这方面极具潜力。

前两年提出的脑机接口,对我们的生活具有一个划时代的意义。关于脑机接口攻坚的两个场景,一是盲人,二是假肢。此外,还有下载技术。其实大家还随身携带一个算力即手机。随着大模型的进步,新一代手机已经能实现很多功能,因此也有人在思考,如何把手机的算力都分布式集中起来。可见,大家都在探索AI的各个方面。

听众提问询问攻克核聚变沉淀态势

*如算法成功模拟人脑逻辑推理能力,会有极大改进

王涛:我也从算力、算法和数据三个层面谈谈。

关于算法。仿真类场景其实也是人工智能的一个方向。深度学习是实现人工智能的一种途径。还有一种是脑科学方案,通过计算机算法的方式来模拟人脑的运作方式。如果我们能用计算机或算法成功模拟人脑逻辑推理能力,那就是算法上的极大改进,这未必是深度学习算法,可能是其他的算法。

所谓的数据,就如刚才认识香蕉的案列,我们给机器什么样的数据,他就学到了什么样的能力。最近的一个例子,有人问AI,3.11与3.9哪个大,很多大模型都说3.11大。因为软件版本迭代时,3.11的版本就是比3.9版本大。人工智能是程序员写的,程序员第一反应就是3.11的版本显然比3.9版本大,所以人工智能也这样认为。可见,人工智能没有意识到这是一个数学比较问题。这有点类似原生家庭里父母对子女的影响,训练一个人工智能的过程就是培养孩子的过程,我们提供怎样的数据,人工智能就给出怎样的反馈。

3.11和3.9谁大?曾经引发网友广泛讨论,此为 GPT-4的类似回答

关于算力。受中美关系的影响,我国的算力与国外的算力相比,落后较多,尤其体现在芯片的设计制造。我们要加大自主发展。随着模型越做越大,数据量会越来越多,需要的算力也越大,同时带来功耗的需求,这就变成一个能源安全问题了。

*算力尽头是能源,算力需求与能源需求几乎同步

沈巍:学界大咖普遍承认,算力的尽头是能源。英伟达的CEO黄仁勋(Jensen Huang)谈算力时提到,未来所有算力所需的能源,需要烧掉14个地球。事实上,我们算力的需求以及我们的发展速度基本上是40%左右,可能每一两年就要翻一番。因为我们现在的芯片工艺,实际上算力的需求翻一番,也意味着电力资源也要翻一番,两者的增速基本上等同。

我们国家的能源增长率基本与GDP增长率一致,假设每年的GDP增长5%至6%,实际上能源的增长率也是5%至6%,那就出现了一个巨大的剪刀差。在2020年9月22日的第75届联合国大会上,我国宣告:中国要在2030年前碳达峰,2060年实现碳中和。这就意味着我们在能源消耗总量上不能再继续爬升。所以,能源是整个信息通信产业共同面对的一个挑战。

“东数西算”实施中亟需加强全国算力与电力一体化

国家也从战略层面提出了“东数西算”的解决方案。事实上,过去的数据中心、算力中心,包括现在最先进的数据中心和算力中心也都建在北上广深这些区域,而电力、能源全都依靠西电东输,依赖长江三峡的电来维持城市的用电需求。如果今后还有大体量的算力增长,那经济信息和安全性等将受很大挑战。与此同时,内蒙古、贵州、庆阳等东数西算的西部节点,一方面能够自给自足,另一方面还能西电东输。因此,选择西电东输后在本地使用,还是直接把算力设施搬到西部在当地消纳,就要算一笔账了。2021年开始启动的全国算力一体化实施方案推进低时延、大带宽、高可靠的新兴网络技术在 “东数西算” 工程中应用,打通国家枢纽节点与非国家枢纽节点间的网络主干道,提升算力网络的传输性能和响应速度,其意义在于实现全国算力资源的高效配置和协同发展,为数字经济的蓬勃发展提供坚实支撑。

算力服务本身也有不同的场景,因为双碳战略,前两年也投资建设了大量的光伏或其他绿色能源基地,但用电负荷又没有与之完全匹配,所以有时发的电被白白舍弃,令人扼腕。国家的算力布局与能源布局会结合得日益紧密。

提问环节,主讲李根国同台回答

*上海建虚拟电厂、循环使用液冷技术的散热能

比如上海还在建虚拟电厂。当处于夏季用电高峰时,通过一些企业,尤其是重点用人单位“削峰填谷”,在该时段发一点电,自己尽量使用自己的电来减少对电网的消耗。因为数据中心里恰好有大量的蓄电池和柴油发电机,平时是作为后备电源考虑的。如果我们响应虚拟电厂“削峰填谷”的需求,用后备电源保障用电,就可以降低对电网的消耗。

此外,数据中心的发热量特别高,单机柜功耗50千瓦时需要12级台风的风速才能冷却。目前都选择了液冷技术,但又会带来另一个延伸的应用。服务器发的热通过风耗散到大气,相当于浪费掉了。单个服务期看起来不多,但全国830万台机柜,全球成千上万台机柜加起来就是一个很大的量。我们一直在考虑如何把服务器的热收集起来,给需要热的地方循环利用。

有些哲学家已经开始思考,AI是否可以定义为一个新的意识或一个新的生物,未来它是否会变成这个样子?人类作为一种生物,未来与AI这种新生物该如何共存?

*积极培养融合人才,灵活使用好各种AI工具

有关算力需求和未来算力的主讲已被制作成两个短视频广泛传播
刘远辉:目前我们对AI的定位是什么?铸造新式生产力。人工智能就是打造新质生产力的工具。计算机在IT时代也是工具,现在急缺的是什么?是融合人才。以开发新药为例,一般需要两个人来做,一个人负责AI,另一人负责制药,两个人说的语言不同,许多事情推动起来非常慢。这就需要一个研发药物且懂AI的人。所以,各行各业应该积极拥抱AI。

在AI领域,其实许多人都在做工具,下一代是探索如何把工具利用得更好、更进步。从AI空间的维度来说,AI不仅产生了意识,还可能从我们的思想中建造 AI新的方向。

王涛:应该把人工智能看作一个工具。人工智能工具特别多,未来必然会导致会用者和不会用者的生产效率差。用任务导向来看,效率高的人自然就会得到更多的自由。所以,我们将来就要学会如何使用人工智能工具。上海在这方面比较领先,一些小学生就在信息技术课上探索人工智能工具的使用。人工智能工具的使用一定是未来提高竞争力的重要方法。

未来生活一定会变得更加美好,因为人类发展科技的目的就是让我们过得更好。

整理:李念 金梦

来源:北京大学出版社

相关推荐