iceberg

多源湖仓数据集成在小米的应用与实践

导读在数据技术快速发展的当下,小米在数据领域积极探索,针对 Iceberg 在内部应用中存在的不足,通过引入 PAImon 对湖仓一体的数据湖底座进行升级重构,并自研数据集成引擎,以此降低使用门槛,更好地满足业务需求与多样化的个性化需求。接下来,让我们一同走进

小米 iceberg cdc schema 数据集成 2025-06-16 09:00  8

阿里云DLF:面向 AI 时代的数据基础设施演进

当今主要数据趋势,是从数据湖和数据仓库,融合到湖仓一体架构,包含计算引擎、元仓、统一的湖格式存储和统一对象存储 OSS。目前业界发展方向,不只是数据湖仓,而是更进一步的将 AI 数据、搜索数据等,都统一在一个更大的数据湖仓中,包括表和文件的统一管理、统一元数据

阿里云 iceberg hive catalog dlf 2025-06-11 11:55  6

阿里云 :AI 时代数据湖仓平台解决方案

导读在 AI 时代的大背景下,数据的存储和访问模式以及数据生成和访问的主体都在发生变化,这对数据平台架构提出了新的挑战和需求。阿里云推出的 OpenLake 解决方案旨在应对这些变化和挑战,为用户提供一个统一、高效、灵活的数据湖仓平台。本文将从数据架构演进的必

模态 阿里云 iceberg 数据仓库 hive 2025-06-10 11:55  6

八年孤独,Iceberg 赢得世界

2024 年 6 月,Databricks 宣布收购由 Iceberg PMC ChAIr Ryan Blue 创办的 Tabular 公司,一时间,Iceberg 未来走向何方,众说纷纭,很多人担忧 Iceberg 项目会因为商业原因被毁掉,甚至 Icebe

iceberg variant kafka catalog 2025-05-30 14:32  8

AI 时代,数据湖的“拐点”与展望

导读2022 年随 LLM/AGI 的革命性突破,数据平台迎来了第三次革命,半非结构化数据的处理能力被 #AI 解锁,数据规模再一次触碰 10 倍扩展的潜力。沉淀在数据湖上的 DarkData 如何被“点亮”?又需要哪些数据湖新能力来支持?

iceberg 存储系统 catalog bigtable 2025-05-30 09:00  7

Iceberg 在华为终端云的应用实践

导读Iceberg 是一种分布式数据湖表格式,聚焦于大规模数据集的高效管理与查询。其优势包括支持行级更新、具备事务及快照功能,并且能实现高效的数据查询,在众多互联网企业中得到了广泛应用。本文将介绍 Iceberg 在华为终端云的实践。

华为 终端 iceberg schema 华为终端 2025-05-23 09:00  7

流批一体数据湖的云原生挑战

回溯至 2022-2023 年间,数据湖尚属前沿技术概念;而时至 2025 年,历经行业的快速迭代与实践沉淀,数据湖已完成从技术创新到主流应用的蜕变。当前,无论是大型企业集团还是初创型企业,均在积极推进数据湖的落地应用,只是各公司的落地进程存在差异,部分头部企

iceberg co hive catalog paimon 2025-05-21 17:28  7