我是新来的scala和火花,我试图将一个Tab分解文件转换为CSV文件,以进一步将其转换为RDD。 其实我试图使用sc.textFile
将Tab分隔文件转换为RDD。它正在实施,但之后的结果如.first()
,.take(n)
不是很系统,即使在使用foreach(println)
后也无法正确读取。 我试图使用Excel将文件转换为csv,但数据大小非常大,它并没有在第一个地方加载。 是否有任何简单的ay 将Tab分隔文件转换为CSV以便获得上述问题的系统结果。转换制表符分隔文件为csv文件
1
A
回答
0
这里是一个小教程:
比方说,你TSV的数据是: row11 \t row12 \t row13... \t row1n row21 \t row22 \t row23... \t row2n
阅读本文件作为字符串RDD:
val readFile = sc.textFile("FILEPAHT HERE")
解析它的内容通过使用标签分隔符:
val parseRows = readFile.map(row => row.split("\t"))
转换行阵列成分隔的字符串 “”
val outputCsvRdd = parseRows.map(row => row.mkString(","))
写出这将是一个CSV文件:
相关问题
- 1. 如何将制表符分隔文件转换为CSV文件
- 2. 将文件(csv,excel,制表符分隔)转换为XML
- 3. 无法将制表符分隔的.txt文件转换为csv
- 4. 如何制表符分隔的文本文件转换为csv文件在Python
- 5. 转换制表符分隔的文件转换成CSV文件在C#
- 6. 转换文件,CSV的分隔符fomat
- 7. 制表符分隔文本文件转换为XML(Javascript或PHP)?
- 8. 将制表符分隔的文本文件转换为JSON
- 9. 使用OpenOffice Calc打开Excel文件并转换为CSV或制表符分隔
- 10. 如何将制表符分隔的文件转换为CSV格式?
- 11. 将数据集转换为文本文件制表符分隔文件
- 12. 将Excel文件批量转换为制表符分隔的文本文件
- 13. 如何XLSX转换为制表符分隔的文件
- 14. 将制表符分隔文件批量转换为xls
- 15. PHP将逗号分隔的字符串转换为CSV文件
- 16. 将字符串字段转换为分隔文件(.csv)
- 17. 将xls文件转换为制表符分隔文件的异常
- 18. 将多个dta文件转换为Stata中的制表符分隔文件
- 19. 需要脚本来将逗号分隔文件转换为制表符分隔
- 20. 使用换行符作为分隔符将文件转换为CSV
- 21. CSV文件分隔
- 22. 修改用于将XML转换为制表符分隔文本文件的XSLT
- 23. 将纯文本文件转换为以管道分隔的CSV文件
- 24. 绘制分隔符为';'的CSV文件。 '(分号+空格)
- 25. 将.txt文件连接到带有制表符分隔符的csv文件
- 26. 将.csv转换/分析为xlsx文件
- 27. 将.csv文件转换为.xls文件
- 28. 将.xls文件转换为.csv文件?
- 29. Summary.glm转换为CSV文件?
- 30. 使用String.split()将文本分隔符分割为csv文件
http://carminedimascio.com/2015/ 02/apache-spark-convert-csv-to-rdd /也许你可以提供你到目前为止已经尝试过的和你的csv样本? – sascha10000
看看这个答案:http://stackoverflow.com/a/33898041 – mfirry