-1
A
回答
1
听起来像要将文件加载为多个分区。如果你的文件是可拆分的(文本文件,快速,序列等),你可以简单地提供它将被加载的分区数量sc.textFile(inputPath, numPartitions)
。如果您的文件不可拆分,它将作为一个分区加载,但您可以在加载的RDD上调用.repartition(numPartitions)
将其重新分区到多个分区。
相关问题
- 1. 如何在火花中处理XML文件?
- 2. 如何处理大型文本文件?
- 3. 火花:如何从火花外壳运行火花文件
- 4. 如何通过火花流处理多个.gz文件?
- 5. 如何将文本文件保存为火花中的orc
- 6. 如何在火花预处理中删除文本中的停用词
- 7. 如何处理火花多行的行?
- 8. 在R中处理大文本文件
- 9. 在C中处理大文本文件#
- 10. 在C中处理大文本文件#
- 11. 在Python中处理大文本文件
- 12. 当文件无法放入火花的主内存中时,火花如何读取大文件(petabye)
- 13. 在火花传输中写入处理文件
- 14. 很多文本文件中的大量数据 - 如何处理?
- 15. 如何处理SbreDav中的大文件?
- 16. 如何处理python中的大文件?
- 17. 如何处理文本文件中,PHP
- 18. 火花如何处理缺失值?
- 19. 如何在asp.net中处理大文本文件
- 20. 火花如何读取文本格式文件
- 21. 如何处理数百万个较小的s3文件与apache的火花
- 22. 处理大型文本文件?
- 23. 如何在python中处理大文件?
- 24. 火花UDF空处理
- 25. 火花如何删除在CSV文件
- 26. 对齐火花标签中的文本
- 27. 如何加快处理一个巨大的文本文件?
- 28. 火花电子邮件处理
- 29. 如何处理gae上的大文件
- 30. 如何处理大的html/js文件?
如果您不指定分区,您现在面临的问题是什么? – tuxdna