当Snowflake大谈特谈Iceberg的互操作性时,Databricks却直接收购了Tabular。
Databricks 已同意收购由 Apache Iceberg 创建者领导的存储平台供应商 Tabular,以促进 Lakehouse 中的数据互操作性。
Tabular 创始人 Ryan Blue 和 Daniel Weeks 于 2017 年在 Netflix 开发 Iceberg,并于 2018 年将其捐赠给 Apache 软件基金会,与此同时,Databricks 正在开发 Delta Lake,这是一种可用于 ACID 事务的开源数据表格式。
2022 年 6 月,Databricks 在其 Delta Lake 2.0 版本中开源了所有 Delta Lake API,并表示将把 Delta Lake 的所有增强功能贡献给 Linux 基金会。
在 Delta Lake 开源之前,Cloudera、Dremio、谷歌(Big Lake)、微软、甲骨文、SAP、AWS、Snowflake、HPE(Ezmeral)和 Vertica 等竞争对手都曾对该公司提出批评,怀疑 Delta Lake 是开源的还是专有的,从而抢走了一部分潜在客户。
Databricks 表示,通过收购 Tabular,它将支持 Lakehouse 的两种领先开源table format,并扩大对其 UniForm Tables 的支持。
该公司在一份声明中表示:“Databricks 打算与 Delta Lake 和 Iceberg 社区密切合作,为 Lakehouse 带来格式兼容性;短期内,在 Delta Lake UniForm 内部实现;长期则朝着单一、开放、通用的互操作性标准发展。”
UniForm(Universal Format),是Databricks在2023年6月发布的一种新的table format,提供跨Delta Lake、Iceberg和Hudi的互操作性,并支持Iceberg restful catalog接口。
1 Snowflake+Iceberg vs. Databricks+Delta分析师也将 Tabular 的收购视为 Databricks 支持更强大互操作性的一种手段。
Omdia 首席分析师 Bradley Shimmin 表示:“我们之前看到,公司经常收购重要开源项目背后的人才,以此在项目的开发者社区中获得更大的话语权。”
Shimmin 解释道:“Tabular 的创始人加入 Databricks 可能意味着 Delta Lake 和 Iceberg 标准之间的兼容性得到提高,这样对于支持数据是在Snowflake平台之外的客户,Databricks将更有优势。”
不过首席分析师指出,此次收购不太可能妨碍 Snowflake 使用 Iceberg,因为 Blue 和 Weeks 早就将该项目开源并捐赠给了 Apache 软件基金会。
Constellation Research 的首席分析师也认为,Apache Iceberg 已经超越了所有其他标准,而 Databricks 为table format创建互操作性的尝试将进一步推动其成为主导的table标准。
此外,分析师指出,竞争不仅仅存在于两种开放table format之间,有可能是 Snowflake 和 Databricks两家公司之争。
Henschen 表示:“此次交易的时间点选择显然是为了转移公众对Snowflake Summit的注意力,并试图在开放性方面胜过竞争对手,暗示Databricks将对 Iceberg 标准以及 Delta Lake 的未来产生巨大影响。”
Snowflake 本周在其博客介绍了自家开源的 Polaris Catalog,Polaris Catalog 是在 Iceberg 之上构建的数据目录,目的是为了让企业使用供应商中立(vendor-neutral)的可互操作的查询引擎,并同时支持数据治理。
分析师认为推出与 Databricks 的 Unity Catalog 类似的 Polaris Catalog 是 Snowflake 采用的一种策略,旨在从竞争对手 Databricks 那里吸引data catalog用户,同时增强其自身产品的吸引力。
Amalgam Insights 的首席分析师也赞同 Henschen 的观点,并表示两家数据湖提供商都在试图证明他们更适合支持各种数据类型/格式的企业数据环境。
Park 解释道:“Databricks 从这次收购中获益良多,因为它表明它可以支持 Iceberg,而 Iceberg 可以说是目前支持最多的table format。”他补充说尽管 Databricks 一直是自己开发项目(如Spark)的优秀开源贡献者,但由于许多大型供应商的承诺,Iceberg 的贡献者社区现在比 Tabular 大得多。
然而Henschen 指出,感兴趣的人太多,任何一家公司都无法主导 Iceberg,尽管 Tabular 的收购可能会让 Databricks 在 Iceberg 方面占据优势。
2 Databricks与Snowflake的收购之争Databricks 最近一直在收购公司,今年 3 月早些时候,Databricks 收购了位于波士顿的 Lilac AI,以帮助企业探索和使用他们的非结构化数据来构建基于 AI 的生成式应用程序。
在此之前,Databricks 以 13 亿美元收购了 LLM 和模型训练软件提供商 MosaicML,在 2023 年 6 月左右以增强其生成式 AI 产品。
在收购 Lilac AI 和 MosaicML 之前,Databricks于去年 5 月以未公开的金额收购了以人工智能为中心的数据治理平台提供商 Okera。该收购预计将增强 Databricks 的数据治理能力,同时训练和管理大型语言模型(LLM),例如其专有的开源 Dolly 2.0 LLM。
Snowflake 也一直在收购一些公司,不仅是为了提升其生成式AI产品,也是为了增强其数据管理能力。
该公司最新的收购是从可观察性平台提供商 TruEra 购买资产,TruEra 是一家初创公司,也专门为机器学习和LLM 提供生命周期管理功能。
去年 5 月,Snowflake以未公开的金额收购了位于加州山景城的初创公司 Neeva,旨在为其数据云平台添加基于人工智能的生成式搜索。
2023 年 2 月,Snowflake 收购了 LeapYear,以增强其data clean room能力。
就在收购 LeapYear 的一个月前,Snowflake 同意收购基于人工智能的时间序列预测平台提供商 Myst AI,这使得该公司三年内的收购数量达到七家。
原文参考:
https://www.infoworld.com/article/3715434/databricks-to-acquire-storage-platform-maker-tabular.html