2017-04-11 46 views
0

我想将spark数据框保存到excel中。如何将火花数据帧保存为excel格式?

我已经通过在每个节点中保存csv文件并使用DataBricks spark-CSV将其附加到服务器中来完成csv。

我不知道如何去做excel。有人请提出建议和想法。

+4

为什么你需要输出一个Excel文件? Spark用于大数据处理。如果你打算使用Excel打开你的输出文件,它不再是大数据。因此,您可以将csv文件转换为不带Spark的Excel文件。单个节点上的Apache POI应该足够了。 –

回答

0

可以在星火使用数据源的HadoopOffice库: https://github.com/zuinnote/hadoopoffice

但是,如果数据量存储非常大,那么它没有那么多的意义,因为Excel本身有问题需要处理大数据文件。