微软又又又崩了 54 个小时

B站影视 2025-01-16 13:39 3

摘要:此前,在 2024 年 11 月 25 日,全球科技巨头微软,服务瘫痪 11 小时,导致包括 Exchange Online、Teams Calendar 在内的多项关键服务无法正常使用,甚至波及到部分客户的 Defender 安全服务。面对如此严重的服务中断

这已经是微软近期崩溃的第三次了。

此前,在 2024 年 11 月 25 日,全球科技巨头微软,服务瘫痪 11 小时,导致包括 Exchange Online、Teams Calendar 在内的多项关键服务无法正常使用,甚至波及到部分客户的 Defender 安全服务。面对如此严重的服务中断,微软只能手动重启服务器以恢复服务

随后在 2024 年 12 月 10 日,微软再次崩溃,Microsoft 365 服务目前处于宕机状态。官方通过其 X 账号证实了这个消息。面对此次崩溃,微软建议受影响的用户使用桌面应用程序。

近日,微软 Azure 云服务遭遇了一次重大中断,持续时间长达 54 小时。此次中断影响了多个 Azure 服务,包括但不限于:

Azure DatabricksAzure Container AppsAzure Function AppsAzure App ServiceSQL Managed InstancesAzure Data FactoryAzure Container InstancesPower BIVMSS(虚拟机规模集)PostgreSQL Flexible Servers

此次故障是由于区域网络服务的配置变更导致服务状态不一致,进而使得三个存储分区出现异常。这一配置变更引发了广泛的虚拟机连接问题和资源分配及通信失败。

出现问题后立即采取了应对措施。首先,通过监控系统发现网络问题后,立即将流量从受影响的可用区转移,以减轻对非可用区服务的影响,并帮助处理新的资源分配。对于那些向受影响可用区发送请求的服务,微软启动了灾难恢复选项以减轻影响。

针对使用私有连接服务的客户,微软迅速应用了补丁并确认了依赖服务的可用性。此外,微软重新启动了多个工作流来恢复受影响的分区,确保其恢复到健康状态。

经过一系列努力,终于在 54 个小时后,所有服务均确认恢复正常。

面对这么多次崩溃,很多用户在 X(原 Twitter) 上纷纷吐槽:“微软到底有没有可能真正学会停止对生产级服务进行未经测试的变更?它们要么未经测试,要么测试方法完全就不充分。两者都同样糟糕,同样不可原谅。

来源:麻辣小王子

相关推荐