嗨我想从文本文件中使用spark读取特定的行。如何从sparkContext读取特定行
SparkConf conf = new SparkConf().setAppName(appName).setMaster(master);
sc = new JavaSparkContext(conf);
JavaRDD<String> lines = sc.textFile("data.txt");
String firstLine = lines.first();
它可以使用.first()命令来获取data.text文档的第一行。我如何访问文档的第N行?我需要Java解决方案。
如果你使用DataFrames进行获取路线,我认为你需要'lines.take(n).apply(n-1)' –
谢谢,我以某种方式解决了这个问题。假设“'n'th”是基于零的:)。 'lines'应该是'JavaRDD',所以'take'会返回一个Java'List',因此'get'而不是'apply'。 –