2
我试图从Hadoop文件系统目录读取/监视txt文件。但我注意到这个目录内的所有TXT文件是目录本身的表现在这个例子波纹管:从Apache Spark读取文件textFileStream
/crawlerOutput/b6b95b75148cdac44cd55d93fe2bbaa76aa5cccecf3d723c5e47d361b28663be-1427922269.txt/_SUCCESS
/crawlerOutput/b6b95b75148cdac44cd55d93fe2bbaa76aa5cccecf3d723c5e47d361b28663be-1427922269.txt/part-00000
/crawlerOutput/b6b95b75148cdac44cd55d93fe2bbaa76aa5cccecf3d723c5e47d361b28663be-1427922269.txt/part-00001
我愿意阅读部分的文件里面的所有数据。我试图用作为显示在这个片段中下面的代码:
val testData = ssc.textFileStream("/crawlerOutput/*/*")
但不幸的是它说,它不存在/crawlerOutput/*/*
。 textFileStream
是否接受通配符?我该怎么做才能解决这个问题?