我只想知道在转换和操作之间textFile被更改时会发生什么。 例如,我从1MB的textFile创建RDD并执行flatMap转换,但在调用动作.collect之前,我用100 MB的textFile替换了本地文件系统中具有相同名称的文件。运算符生成图形
由于Operator Graph是在动作调用之后生成的,因此不应该从大文件计算DAG?
// RDD created from 1 MB File size
val a = sc.textFile("c:/SampleData.txt").flatMap(x => x.split(" "))
// Replace the textfile SampleData.txt(1 MB size) with SampleData (100 MB size)
a.collect
但当我这样做,我得到这个例外
Caused by: java.io.EOFException: Cannot seek after EOF