摘要:这两家公司起初从不同的市场定位和技术视角出发,Databricks更专注于非结构化数据处理和实时分析,而Snowflake则专注于云端数据仓库的抽象化和简化。但随着两家供应商的发展壮大,它们已成为数据科学和机器学习平台新兴市场的直接竞争对手,这些平台已成为支持
当CIO们描述如何成功启动AI项目时,两个供应商名称总是频繁出现:Databricks和Snowflake。
这两家公司起初从不同的市场定位和技术视角出发,Databricks更专注于非结构化数据处理和实时分析,而Snowflake则专注于云端数据仓库的抽象化和简化。但随着两家供应商的发展壮大,它们已成为数据科学和机器学习平台新兴市场的直接竞争对手,这些平台已成为支持AI和其他自动化项目的宝贵工具。
研究公司Gartner将此类别内的平台定义为基于代码的库和低代码工具的集成套件。这些功能广泛的平台使数据科学家能够在整个数据科学生命周期中与IT和业务领导者协作,包括业务理解、数据访问和准备、模型创建以及洞察分享。
过去三年生成式AI的爆炸性发展极大地扩展了数据平台市场,许多行业的企业都转向这些平台来帮助转型关键业务流程和运营。
AI发展的加速器
在最近的生成式AI爆发之前,Databricks就专注于机器学习和传统AI。该公司联合创始人兼工程副总裁Patrick Wendell表示,生成式AI的爆发像"类固醇注射"一样加速了数据平台市场的发展。这是因为组织开始意识到真正的价值和投资回报率来自于组织和挖掘自己的数据。
"消息正在传播,关于你自己的数据以及如何最成功的AI项目是建立在你自己的内部数据之上,而不是使用从互联网某处挖掘的ChatGPT答案,"Wendell说。
AI驱动音频公司Datavault AI的CEO Nathaniel Bradley表示,虽然Databricks和Snowflake在这个领域有很多竞争对手,但这两家供应商已找到了持续为他们赢得新客户的利基市场。
Bradley说,Snowflake在易用性、安全性和大规模结构化数据分析方面表现出色,而Databricks是一个开发者优先的环境,拥有强大的机器学习和AI工具以及对多模态工作负载的支持。
"这两家公司的吸引力在于它们如何向上发展,不仅仅是存储或处理平台——它们现在是集成的AI编排环境,"Bradley补充道。"企业需要的平台不仅能存储和查询数据,还能实现协作模型训练、数据版本控制和生产级推理。"
云互操作性
数据和IT咨询服务提供商Resultant的CTO Justin Bolles补充说,这两家供应商还因为云中立而获得了加分。他指出,两者都在三大主要云提供商上运行。
他说,两家公司向平台方法的转变也是一个卖点。"两者都扩展为端到端平台,允许数据存储、分析和可视化,"他解释道。"这简化了平台的安全性、补丁和操作。"
金融行业SaaS提供商和Snowflake客户TS Imagine的COO兼首席数据和分析官Thomas Bodenski补充说,易用性是这些数据分析平台的一大优势。
"这就像一个一站式商店,"他说。"我不需要在许多不同的平台和技术之间移动,因为我在一个地方拥有一切;我可以做SQL,我可以处理数万亿行的大数据,我可以进行快速查询,所有的大语言模型都在那里原生运行。"
Bodenski说,使用Snowflake,他不需要数据库管理员或系统管理员。"我的数据工程师和数据科学家可以自助服务,而且几乎零维护,"他补充道。
IDC的AI和自动化分析师Devin Pratt表示,平台方法以及技术不可知论是Databricks和Snowflake成功的关键。
"它们都试图为最终用户提供统一的数据平台,使复杂任务(如AI)尽可能易于使用,它们都试图通过存储和计算的分离来实现这一点,"他说。"你看到的不仅仅是这两家供应商,还有很多其他供应商,基本上都是存储不可知的,无论你的数据在哪里,什么类型的数据,我们都将把它连接在一起。"
在这种平台方法下,Databricks数据智能平台包括商业智能、数据仓库、AI和数据科学功能、实时分析和编排。Snowflake的平台允许客户构建数据管道、运行分析、创建和部署AI和机器学习工具,并在云和组织之间共享实时数据。
不断发展的市场
Snowflake的CEO Sridhar Ramaswamy说,除了平台方法外,简单性是Snowflake成功的关键要素。该公司的两位联合创始人来自Oracle,看到了复杂系统如何快速拖累客户。
"即使在AI之前,产品理念的一部分就是技术应该简单易用,"Ramaswamy说。"他们着手创建一个不需要大量需要持续调整的旋钮的产品。他们相信自调优系统。"
他补充说,与其他产品(包括多个AI模型)的集成是该理念的一部分。"我们非常重视产品凝聚力和产品简单性,这意味着我们非常关注产品的每个部分与其他事物的协作。"
Databricks的Wendell说,Databricks采用数据分析平台方法,但公司也认识到客户需要与AI模型和其他工具的互操作性。
"互操作性的关键是最关键的接口需要开源,因为首先,这是一个锁定问题,"他补充道。"没有人想把他们的存储锁定在专有格式中,如果核心东西不开放,我们无法说服客户押注于我们。"
Resultant的Bolles指出,Databricks和Snowflake的前景都很光明,但数据科学和机器学习平台市场远未尘埃落定,竞争来自多个角落,包括云提供商本身,谷歌提供其BigQuery产品,微软推动其Fabric工具。还有几个其他较小的供应商也在这个领域竞争。
他说,市场正在快速发展,用户组织将转向供应商,确保他们的数据治理和编目准备好支持AI的下一次演进。
Bolles补充说,生成式AI的下一个重大演进是自助商业智能。"这将询问数据和构建数据可视化的能力交给最终用户,而不需要BI工程师来创建可视化。"
IDC的Pratt认为伙伴关系是数据科学和机器学习平台领域增长的关键,最佳数据库和最佳数据治理工具协同工作,提供全面的数据和分析解决方案。
"平台厂商显然有一点先发优势,更容易在内部整合生成式AI,现在是智能体AI,到这些系统中,因为这一切都在一个供应商之下,"他说。
Q&A
Q1:Databricks和Snowflake各自有什么优势特点?
A:Snowflake在易用性、安全性和大规模结构化数据分析方面表现出色,用户不需要数据库管理员,几乎零维护。Databricks是开发者优先的环境,专注于非结构化数据处理和实时分析,拥有强大的机器学习和AI工具。
Q2:为什么这两家公司在企业AI市场竞争激烈?
A:两家公司都从数据存储平台发展为端到端的AI编排环境,提供数据存储、分析、可视化以及AI模型部署的一站式服务。生成式AI的爆发像"类固醇注射"一样加速了数据平台市场发展,企业意识到真正价值来自挖掘自己的内部数据。
Q3:数据科学和机器学习平台市场未来会如何发展?
A:市场正快速发展,竞争来自多个角落包括谷歌BigQuery和微软Fabric等云服务商。下一个重大演进是自助商业智能,让最终用户直接进行数据查询和可视化。伙伴关系将是增长关键,最佳数据库和治理工具协同提供完整解决方案。
来源:至顶网一点号