【安全圈】拦截钓鱼网址操作失误致Cloudflare服务中断

B站影视 2025-02-24 20:04 2

摘要:昨日,Cloudflare 的 R2 对象存储平台在试图拦截一个网络钓鱼网址时适得其反,引发了一场大规模故障,导致多项服务中断近一小时。

网络钓鱼

昨日,Cloudflare 的 R2 对象存储平台在试图拦截一个网络钓鱼网址时适得其反,引发了一场大规模故障,导致多项服务中断近一小时。

Cloudflare R2 是一种类似于 Amazon S3 的对象存储服务,旨在实现可扩展、持久且低成本的数据存储。它提供免费的数据检索、与 S3 的兼容性、跨多个地点的数据复制以及与 Cloudflare 服务的集成。

此次故障发生在昨日,当时一名员工对 Cloudflare R2 平台中一个网络钓鱼网址的滥用报告做出回应。然而,该员工没有拦截特定的端点,而是错误地关闭了整个 R2 Gateway 。

Cloudflare 在事后调查报告中解释称:“在一次常规的滥用整治过程中,对一项投诉采取的行动无意中禁用了 R2 网关服务,而不是与报告相关的特定端点 / 存储桶。”

“这首先是多个系统层面控制措施的失效,其次是操作人员培训的不足。”

该事件持续了 59 分钟,从协调世界时 08:10 至 09:09,除了 R2 对象存储本身,还影响了以下服务:

1.Stream:视频上传和流媒体传输 100% 失败。

2.Images:图片上传 / 下载 100% 失败。

3.Cache Reserve:操作 100% 失败,导致源请求增加。

4.Vectorize:查询失败率达 75%,插入、更新插入和删除操作 100% 失败。

5.Log Delivery:出现延迟和数据丢失,与 R2 相关的日志数据丢失率高达 13.6%,非 R2 交付任务的数据丢失率高达 4.5%。

6.Key Transparency Auditor:签名发布和读取操作 100% 失败。

还有一些服务受到间接影响,出现部分故障。例如,Durable Objects因恢复后的重新连接导致错误率增加了 0.09%;Cache Purge的错误率(HTTP 5xx)增加了 1.8%,延迟飙升至原来的 10 倍;Workers & Pages 的部署失败率为 0.002%,仅影响与 R2 绑定的项目。

服务可用性图

Cloudflare 指出,人为错误以及缺乏对高影响操作的验证检查等保障措施是此次事件的关键原因。

这家互联网巨头现已立即实施修复措施,比如在滥用审查界面中移除关闭系统的功能,并对Admin API进行限制,以防止内部账户禁用服务。

未来还将实施的额外措施包括改进账户配置、加强访问控制以及对高风险操作实行双方审批流程。

2024 年 11 月,Cloudflare 也曾经历过一次长达 3.5 小时的重大故障,导致该服务中 55% 的日志永久性丢失。

那次事件是由于向公司日志管道中的一个关键组件推送了错误配置,引发了 Cloudflare 自动缓解系统的连锁故障。

网罗圈内热点 专注网络安全

支持「安全圈」就点个三连吧!

来源:做个梦给你1128

相关推荐