0
以下是我用于将数据帧写入JSON的代码。我从飞艇上运行此代码:无法将火花数据帧写入json文件
val df = Seq((2012, 8, "Batman", 9.8), (2012, 8, "Hero", 8.7), (2012, 7, "Robot", 5.5), (2011, 7, "Git", 2.0)).toDF("year", "month", "title", "rating")
df.write.json("/tmp/out.json")
我想到的是写在/tmp/out.json文件数据帧的数据。然而,它是创建名称为“/tmp/out.json”目录里面,我觉得以下两个文件:
_SUCCESS
._SUCCESS.crc
这些文件都不是有JSON数据。我在这里错过了什么?
是你运行一个集群还是只在本地?如果集群是否检查了执行程序上的输出目录,而不是在驱动程序机器上? – ImDarrenG
@ImDarrenG我可以在执行器上看到json数据。它被分割成执行者。有没有办法让一个json文件中的所有json数据? –
是的,有可能,请参阅:http://stackoverflow.com/a/40594798/7098262 – Mariusz