overhead

小h漫谈(20):RDD的特性

一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合。Spark Core建立在统一的抽象RDD之上,使得Spark的各个组件可以无缝进行集成,在同一个应用程序中完成大数据计算任务。

dis fault rdd overhead lineage 2025-04-20 22:46  2