GenAI和灵活消费模式重塑混合存储基础设施

B站影视 港台电影 2025-06-16 19:31 1

摘要:GenAI重塑混合存储!评估AI需求,关注延迟与响应,应对工作负载变化。混合解决方案兼顾数据安全、成本与性能。灵活消费模式优化支出,订阅模式助力云和本地扩展,打造高效AI基础设施,拥抱“AI+云原生”未来!

GenAI重塑混合存储!评估AI需求,关注延迟与响应,应对工作负载变化。混合解决方案兼顾数据安全、成本与性能。灵活消费模式优化支出,订阅模式助力云和本地扩展,打造高效AI基础设施,拥抱“AI+云原生”未来!

译自:GenAI and Flexible Consumption Models Reshape Hybrid Storage Infrastructure

作者:Jeb Horton

生成式人工智能 (GenAI) 的使用正在各个行业以前所未有的速度增长。人工智能模型、计算能力和数据的重大技术进步,以及在生产力、成本和易用性方面的优势,推动了这种扩张。GenAI 的全球市场规模预计今年将达到 627.2 亿美元,到 2030 年将达到 3560 亿美元。

随着这种采用,对资源的需求也随之而来。因此,各组织现在专注于如何高效地使用 GenAI,包括减少用电量、降低 GPU 消耗,以及总体上使用碳密集度较低且更可持续的基础设施。DeepSeek 的崛起只会加剧人们对 AI 基础设施优化的兴趣。

这种需求也推动了人们对灵活消费模式和可扩展基础设施的兴趣。为了避免大量的前期成本,公司正在采用灵活的订阅和按需付费模式,使他们能够从小处着手并快速扩展。随着价格下降和灵活模式的普及,GenAI 将变得越来越普遍,从而推动更高的需求。从长远来看,灵活的模式将使 GenAI 更加高效、经济和可持续。但是,在混合、灵活的模式中实施 Gen AI 需要几个步骤和考虑因素。

开发人员应该首先清楚地了解其 Gen AI 项目的工作负载和性能属性。定义用例——LLM、副驾驶、图像生成器、聊天机器人或多模态 AI——并映射 AI 管道,从数据预处理、模型训练、模型评估、推理和微调。分析工具可帮助确定吞吐量、延迟、并发性和突发性等领域。AI 管道的每个部分都有不同的存储要求,因此通常有必要根据具体情况将基础设施与工作负载对齐。如果使用量低于预期,则使用提供出色性能的解决方案可能会造成浪费。灵活的消费模式可以帮助适应快速变化的需求。

此外,请考虑贵公司规模、地理位置和资源的独特特征。例如,某些地区的能源成本较低,而另一些地区的能源成本较高。技术因素——例如数据中心成本结构、云计算成本、数据传输成本和网络相关费用——至关重要。

性能容易受到延迟的影响,因为即使是 100 到 200 毫秒的延迟也会影响用户体验。基础设施应确保计算、网络和存储层都构建为能够处理 Gen AI 应用程序生成的工作负载。通过将计算和存储并置来最大限度地减少数据移动。智能缓存和预加载常用提示、模型或嵌入到内存中也可以减少延迟。

解决延迟的另一种方法是考虑数据引力——随着项目规模的扩大,移动数据变得越来越困难和昂贵的概念。一种误解是所有数据都是相同的,并且存储在哪里并不重要。但是数据并不相同,并且通过互联网提取数据可能会降低延迟并影响性能。因此,避免移动大型数据集并增加与数据的接近程度。例如,使用现有数据训练模型。

要避免的一个陷阱是不了解工作负载需求如何随时间变化。Gen AI 工作负载需求在开发、测试和生产之间可能会发生显着变化。因此,开发人员应该设计模块化、可扩展的增长,以适应使用量、客户需求或产品扩展的快速增长。 存储、网络或计算层的瓶颈是通用人工智能(Gen AI)的常见问题。范围不足的组件会损害整体体验。将所有三层作为一个实体来解决的统一解决方案将保持系统可靠性,并在重负载下满足性能需求。

许多组织现在利用混合解决方案来解决不断上涨的数据存储成本。 此外,还有一个问题是哪些数据存储在云中或混合架构的本地部署中。 此决策的关键因素包括安全性、成本、性能和可持续性。数据安全和隐私对于确保人工智能基础设施的安全至关重要。 私有、机密或具有知识产权的数据通常最好在本地管理。

由于硬件、计算、能源和安全成本,GenAI 基础设施的构建和维护成本很高。 如果企业能够达到有吸引力的每 GB 成本,他们可能会考虑支持 AI 的本地存储解决方案。 这可以通过从与 AI 存储要求相符的服务目录中以服务形式使用基础设施来实现。 否则,由于云提供商的规模,云选项可能更有意义。

组织通常选择本地解决方案,因为它们允许支持一致性能的专用架构,范围从对象存储到极端多处理。 然后,可以在服务目录中引用这些存储解决方案,并将其与上游组件(如计算和网络)对齐,以确保满足关键服务指标。

可持续性也很关键,因为数据中心需要大量电力,以及对长期节能和法规遵从性的担忧。 本地解决方案提供更多的控制和效率提升。 虽然云提供商通常是远程的,但他们受益于规模,这可以抵消一些可持续性问题。

灵活的消费模式为组织提供了更多选择,可以根据其特定需求优化支出。 特别是 AI 的高成本和能源需求,使灵活的消费模式成为一个有吸引力的选择。 最近推出的更具成本效益的选项(如 DeepSeek)增加了人们对从小规模开始并快速扩展的兴趣。

混合模型非常适合这种方法,支持按需付费的订阅模式,允许根据需要快速向上和向下扩展。 需要实时处理的任务可以保留在本地,而计算密集程度较低的工作负载可以移动到云端。 此外,企业希望将云订阅的灵活性应用于其本地基础设施。 目标是创建一个混合世界,其中云和本地部署都基于订阅模式运行。

最后,作为基于消费的使用的服务目录有助于缓解超支或性能不佳的问题。 这使客户能够仅消耗他们在特定时间内从特定类别中需要的内容。

在生成式 AI 的新世界中,基础设施将依赖于本地和云环境的战略组合。 由于其巨大的资源需求和对快速可扩展性的要求,AI 是最终的混合应用程序。 灵活的消费模式是这种转型的关键,因为它们使企业能够最大限度地减少前期成本,同时保持最大的灵活性,以便在本地或云设置中进行扩展。

来源:小熊看科技

相关推荐