为什么 Netflix 总比其他视频网站快3倍?CDN 巨头的&

B站影视 内地电影 2025-09-17 16:23 1

摘要:前几天,计算机网络与通信领域最权威的会议SIGCOMM 2025公布了最佳学生论文奖,获奖的是一篇叫《Edge Caching as Differentiation》的研究。

前几天,计算机网络与通信领域最权威的会议SIGCOMM 2025公布了最佳学生论文奖,获奖的是一篇叫《Edge Caching as Differentiation》的研究。

乍一看标题挺学术的,但这项研究揭露的问题却和我们每个人的上网体验息息相关。简单说就是:为什么同样的网络,看 Netflix 就是比看其他视频网站流畅?为什么刷某个社交APP总是图片秒开,而另一个就要转圈圈?

先说个简单的比喻。假如你住在成都,想买一瓶白云边的酒,有两种方式:

方式A:直接从湖北松滋的酒厂邮寄过来,需要3-4天方式B:从社区旁边的“便利店”直接买,10分钟搞定

边缘缓存就像遍布全国的"便利店",把热门内容提前放在离用户最近的地方。当你点开一个视频,服务器会优先从最近的"缓存便利店"调取内容,而不是千里迢迢从原始服务器传输。

如果把缓存系统比作物流网络:

L1缓存:就像社区便利店,离用户最近,但空间有限L2缓存:像区域仓库,空间更大但距离较远原始服务器:就是生产工厂,最远但容量无限

用户访问内容时,系统会先检查便利店(L1),没有再去仓库(L2),最后才去工厂(原始服务器)。每多走一层,延迟就增加一点。研究发现,L1缓存的命中与否对用户体验影响最直接。

理论上,这个机制对所有内容都是公平的。但瑞士联邦理工学院和弗吉尼亚理工大学的研究团队不信邪,他们要用数据说话。

为了揭开边缘缓存的真相,研究团队展开了一场堪称"豪华"的全球测试。

他们在8个不同的地理位置部署了测量节点,包括:

美国的圣何塞、波特兰、哥伦布、阿什本英国伦敦爱尔兰都柏林德国法兰克福印尼雅加达

这些地点的选择很有讲究:既覆盖了主要的发达市场(美欧),也包含了重要的新兴市场(东南亚),能够反映全球不同地区的真实网络环境。

测试对象也不简单:Akamai、Cloudflare、Amazon CloudFront、Fastly、Edgio这5家缓存服务商,基本上垄断了全球大部分的CDN市场。

可以说,你平时访问的绝大多数网站,背后都有它们的身影。

更重要的是,这不是一次性的"快照"测试,而是持续一个月的系统性监测。每天,每个测试节点都会向不同的内容提供商发送请求,记录缓存命中率、响应时间等关键指标。

结果发现了一个让人意外的现象。

一个月的数据收集下来,研究团队的发现可以用"触目惊心"来形容:

同一家缓存服务商,服务不同视频平台的表现可能天壤之别。最极端的情况下,平台A的缓存命中率能达到100%,而平台B只有30%。

这意味着什么?

如果你在印尼看视频,访问平台A时,所有内容都能从本地缓存秒开;而访问平台B时,70%的内容都需要从遥远的原始服务器调取,延迟可能高达几百毫秒甚至更多。

具体到用户体验上:同样的跨国网络环境下,用户观看平台A视频的画质能达到18Mbps(接近4K画质),而观看平台B的画质只有10Mbps(勉强算高清)。在网速25Mbps的环境下,不同平台的视频启动延迟差距能超过1.5秒。别小看这1.5秒,对很多用户来说,这已经足够让他们失去耐心,点击别的视频了。

在不同地区的测试还发现了有趣的地域性差异:在美国和欧洲,主流平台的缓存表现相对均衡,但在印尼这样的新兴市场,差异会更明显。比如从雅加达访问时,某些内容的请求竟然被路由到了土耳其伊斯坦布尔或以色列特拉维夫的缓存节点,而不是就近的本地缓存。

相比视频网站,社交媒体平台受到的影响相对较小,因为刷社交媒体时,多等几百毫秒加载图片往往不会让人特别烦躁,加上预加载机制进一步缓解了影响。但差异仍然存在,不同社交平台的首次内容加载时间能相差几百毫秒。

你可能会问:缓存服务商不是应该公平对待所有客户吗?

确实,从商业角度看,Akamai、Cloudflare这些公司没理由故意偏心某个客户。问题出在哪里?

流行度决定一切缓存空间是有限的,就像便利店的货架。热门商品肯定优先摆放,冷门商品可能根本进不了店。同样道理,Netflix、YouTube这些巨头的内容因为观看人数多,更容易"霸占"缓存空间。而小众平台的内容,由于请求量少,经常被"挤出"缓存,用户访问时就得等待从原始服务器调取。

定价机制的"意外后果"更有意思的是,现在主流缓存服务商的收费模式是按流量计费,不管你的内容是从缓存命中还是从原始服务器调取,收费都一样。

这就造成了一个微妙的情况:Netflix和某个小型视频网站付同样的每GB费用,但Netflix因为内容更热门,缓存命中率更高,实际享受的服务质量却好得多。这就像两个人付同样的快递费,但一个走的是顺丰当日达,另一个走的是普通快递。

某大厂甚至还有个"未命中税"——如果内容在缓存中找不到,需要额外收费0.085美元每GB。对于一个不那么热门的网站,处理10TB内容可能要额外付7600美元,而Netflix几乎不用付这笔钱。

这种看似技术层面的差异,实际上可能影响整个互联网生态:

马太效应加剧

用户体验好的平台会吸引更多用户,更多用户意味着更高的缓存命中率,更高的缓存命中率又带来更好的用户体验。这是一个正循环,但对小平台来说,却是恶性循环。

创业门槛抬高

对于想要挑战YouTube、Netflix的创业者来说,技术和内容可能都不是最大障碍,真正的挑战可能是:如何让用户在体验你的服务时,不会因为缓存命中率低而感到卡顿。

用户选择的"隐形偏见"

用户通常会选择体验更流畅的服务,但他们可能不知道这种流畅很大程度上来自于缓存优势,而不是产品本身的优劣。

作为普通用户,当你发现某个网站或APP特别卡顿时,问题可能不在你的网络,而在于这些更深层的技术因素。支持创新和多样性需要我们有更多耐心——那些还在起步阶段的平台,可能需要面对更多技术挑战,但它们的创新价值不应该被缓存效率掩盖。

面对这个问题,研究团队提出了几个思考方向:

透明化运营

缓存服务商应该公开更多运营数据,让客户知道自己花的钱买到了什么质量的服务。就像外卖平台会显示配送时间一样,缓存服务也应该有相应的透明度。

差异化定价

既然服务质量有差异,定价就应该反映这种差异。热门内容享受更好的缓存效果,理应付更高的费用。

算法优化

开发更公平的缓存算法,在保证整体效率的同时,给小众内容更多机会。比如设置一定比例的缓存空间专门给长尾内容。

基础设施多元化

随着边缘计算越来越重要,如何平衡效率与公平将成为行业必须面对的问题。

一些可能的发展方向:

更智能的缓存算法,能够在效率和公平之间找到更好的平衡点更多样化的缓存服务模式,给不同规模的企业更多选择政策层面的关注,将边缘缓存纳入数字公平的讨论范围

研究团队还提出了一个更具前瞻性的研究方向:结合网络感知的流行病学模型,研究缓存性能与内容流行度之间的相互作用。简单说就是,边缘缓存的"偏心"是否会影响内容的传播速度,进而影响什么内容能够"火"起来。

这篇获奖论文让我们看到了互联网基础设施的另一面。技术从来不是中性的,即使是看起来公平的设计,在现实中也会产生倾斜。

边缘缓存的"偏心"问题提醒我们:在享受技术便利的同时,也要思考技术发展是否惠及所有人。一个真正健康的互联网生态,不应该让技术优势成为少数巨头的护城河,而应该为创新和多样性留出空间。

毕竟,今天的Netflix也曾经是挑战者,今天的小网站也可能是明天的行业巨头。关键是,我们要确保技术进步不会让这种可能性越来越小。

本文首发:边缘计算社区,本文观点内容基于EPFL等研究团队在ACM SIGCOMM 2025发表的获奖论文《Edge Caching as Differentiation》

来源:边缘计算社区一点号1

相关推荐