摘要:10月29日,微软云服务平台Azure发生全球性大规模宕机,持续时间超过8小时。从阿拉斯加航空的值机系统到英国希思罗机场网站,从星巴克支付到医疗机构平台,众多依赖Azure的服务同时陷入困境。
一次看似普通的配置更改,让全球云计算巨头微软Azure陷入长达9小时的瘫痪,航空、医疗、零售纷纷告急。
10月29日,微软云服务平台Azure发生全球性大规模宕机,持续时间超过8小时。从阿拉斯加航空的值机系统到英国希思罗机场网站,从星巴克支付到医疗机构平台,众多依赖Azure的服务同时陷入困境。
这已是短短十天内第二次重大云事故——本月20日,亚马逊AWS刚发生过持续15小时的大规模中断。全球排名前二的云服务提供商接连“罢工”,折射出现代互联网基础设施的脆弱性。
---
01 宕机全景:一次错误配置,半个互联网停滞
微软Azure这次宕机并非小事。根据网络监测平台Downdetector数据,最高峰时有超过1.8万人报告Azure服务中断,近2万人报告Microsoft 365出现故障。
Azure部门很快确认,导致这次全球瘫痪的根源是一个 “无意间的设定变更”。
具体来说,问题出在Azure Front Door服务上,这是微软的全球内容分发网络和网关。
微软在初步调查报告中解释:“在Azure Front Door中,一次意外的租户配置更改引发了广泛的服务中断。”
无效的配置导致大量AFD节点无法正常加载,引发下游服务延迟增加、超时和连接错误。
02 连锁反应:从航空到医疗,关键服务纷纷中断
阿拉斯加航空和夏威夷航空29日稍早发表声明,由于Azure服务中断,包括公司官网在内的多个关键系统受到影响。
航空公司不得不提醒乘客:“无法在线值机的旅客请前往机场柜台领取登机牌,并在候机大厅预留更多时间。”
英国希思罗机场网站一度无法连接,电讯巨头Vodafone服务受阻,好市多、星巴克和零售企业克罗格也告知用户其网站和应用程序“出现意外中断”。
开源社区同样未能幸免。Kubernetes管理工具一度无法访问,加拿大魁北克的医疗机构Santé Québec报告部分病患访问系统暂停运行。
微软自家服务更是“重灾区”,包括Office 365、Minecraft、Xbox Live和Copilot在内的多项服务均出现不同程度的中断。
03 云依赖:巨头垄断与系统性风险
康奈尔大学工程学教授格法德表示,此类网络服务中断频发,暴露了现代互联网的脆弱性。
“由于云端服务的成本(高昂),导致资源集中在少数几家大型企业手中,实际上是把所有的鸡蛋都放在了三个篮子里。”
根据分析公司Canalys的数据,截至第一季度,亚马逊AWS全球市场占有率为32%;微软Azure位居第二,市占率为23%;谷歌云端服务Google Cloud紧随其后,市占率为10%。
研究公司eMarketer的分析师伯恩认为,随着对云端服务平台的依赖和工作负载的增多,这类服务中断可能会对各行各业造成更严重的打击。
前美国联邦贸易委员会(FTC)委员罗希特·乔普拉直言:“我们必须意识到,云服务的高度集中不仅带来不便,更是一种真实的系统性脆弱性。”
04 宕机经济学:损失巨大,教训昂贵
云服务中断造成的经济损失难以精确计算,但肯定是个天文数字。专家指出,全球性网络故障造成的经济损失,可能高达数百亿甚至数千亿美元。
网站性能监测服务商Catchpoint CEO迈赫迪·达乌迪表示:“像这样的宕机在短短几小时内就可能让行业损失数千万美元。”
这已不是微软第一次出现严重网络事故。今年3月,该公司就曾因故障导致数万用户无法使用Outlook等服务。
但金钱并不是唯一的损失。更令人担忧的是全球数字系统的集中化依赖,正在成为新的“系统性风险”,而任何一处技术故障都可能引发全球连锁反应。
05 云未来:多元化部署与智能进化
尽管事故频发,云计算与AI的深度融合仍是未来趋势。2025年,云计算已从早期的IT基础设施升级工具,演变为企业数字化转型的核心引擎。
中国信息通信研究院发布的《云计算蓝皮书(2025年)》显示,云计算服务呈现出AIIaaS、AIPaaS、MaaS、AISaaS、AIMSP等全产业链进化趋势。
从厂商层面看,头部格局基本形成。咨询机构弗若斯特沙利文报告显示,2025年上半年,中国全栈AI云服务市场规模达259亿元,其中阿里云以30.2%市场份额位居第一,百度智能云以22.5%的市场份额位居第二。
分析人士指出,这几次服务中断事件或许会加速相关企业推动其云端服务多元化的进程,多云端部署、“灾后恢复”演练、供应商风险管理将升级为各机构的 “生存必需要素”。
企业级云服务正在从“资源上云”向“深度用云”演进,通过云原生、AI大模型集成和垂直行业解决方案,构建更智能、更可靠的数字基础设施。
---
网站性能监测服务商Catchpoint CEO Mehdi Daoudi的警告言犹在耳:“我毫不怀疑下周又会有另一家《财富》100强企业遭遇类似问题。即便是最先进的基础设施,韧性缺口依然普遍存在。”
当我们的数字命运掌握在少数几家云服务巨头手中,一次配置错误就足以让全球网络颤抖。云计算的便利性与集中化风险如同一枚硬币的两面,共同塑造着互联网的未来。
来源:程序员讲故事聊生活
