技术应用 | 基于Flink+Hudi的实时数据湖建设 目前商业银行数据仓库主要采用基于MPP(Massively Parallel Processing)架构的离线数据存储计算方式,离线数仓的数据源主要以文件形式提供,由统一批量采集传输原始数据至客户端服务器,对数据进行清洗、转换、加载至MPP数据库贴源层,然后再 应用 kafka cdc hudi flink 2025-05-23 11:03 3