小h漫谈(20):RDD的特性 一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合。Spark Core建立在统一的抽象RDD之上,使得Spark的各个组件可以无缝进行集成,在同一个应用程序中完成大数据计算任务。 dis fault rdd overhead lineage 2025-04-20 22:46 2