阿里云DLF:面向 AI 时代的数据基础设施演进
当今主要数据趋势,是从数据湖和数据仓库,融合到湖仓一体架构,包含计算引擎、元仓、统一的湖格式存储和统一对象存储 OSS。目前业界发展方向,不只是数据湖仓,而是更进一步的将 AI 数据、搜索数据等,都统一在一个更大的数据湖仓中,包括表和文件的统一管理、统一元数据
当今主要数据趋势,是从数据湖和数据仓库,融合到湖仓一体架构,包含计算引擎、元仓、统一的湖格式存储和统一对象存储 OSS。目前业界发展方向,不只是数据湖仓,而是更进一步的将 AI 数据、搜索数据等,都统一在一个更大的数据湖仓中,包括表和文件的统一管理、统一元数据
导读聚焦 Data+AI 融合趋势下的数智开发平台构建,系统阐述当前数据平台在烟囱式架构下的技术挑战,提出 WeData 面向 Data+AI 的新一代数智开发平台的四层设计方案。
导读在大数据和 AI 时代,统一元数据管理解决方案在数据治理中扮演着关键角色,Apache Gravitino 提供了元数据管理的新范式。通过统一命名、权限、血缘等机制,提升了数据使用和治理效率,尤其在 Iceberg 数据湖架构中展现出优势。Apache G
2024 年 6 月,Databricks 宣布收购由 Iceberg PMC ChAIr Ryan Blue 创办的 Tabular 公司,一时间,Iceberg 未来走向何方,众说纷纭,很多人担忧 Iceberg 项目会因为商业原因被毁掉,甚至 Icebe
导读2022 年随 LLM/AGI 的革命性突破,数据平台迎来了第三次革命,半非结构化数据的处理能力被 #AI 解锁,数据规模再一次触碰 10 倍扩展的潜力。沉淀在数据湖上的 DarkData 如何被“点亮”?又需要哪些数据湖新能力来支持?
这位记者采访了美国知名音乐历史学者Ted Gioia,后者直言不讳地指出,当代文化创作已陷入创造力枯竭的困境,艺术与娱乐的整体质感正在肉眼可见地滑坡,其影响甚至辐射至一个国家的社会情绪与政治稳定。
回溯至 2022-2023 年间,数据湖尚属前沿技术概念;而时至 2025 年,历经行业的快速迭代与实践沉淀,数据湖已完成从技术创新到主流应用的蜕变。当前,无论是大型企业集团还是初创型企业,均在积极推进数据湖的落地应用,只是各公司的落地进程存在差异,部分头部企