集团数据湖表优化与管理实践
抖音集团内部使用的数据湖格式称为 ByteLake,它是基于 Apache Hudi 深度定制的一个数据库框架,其核心功能包括支持 ACID、增量消费更新和湖仓统一元数据管理,适用于数仓分析、交互式分析及特征工程等场景。
抖音集团内部使用的数据湖格式称为 ByteLake,它是基于 Apache Hudi 深度定制的一个数据库框架,其核心功能包括支持 ACID、增量消费更新和湖仓统一元数据管理,适用于数仓分析、交互式分析及特征工程等场景。
本文主要针对 Feed 流进行介绍,将从 Feed 流的演变入手,带你一步步了解 Feed 流,而后学习如何从开发角度入手,对其进行建模,抽象出 Feed 流常见的架构,最终搭建高可用、高扩展、高性能的 Feed 流应用。