2016-06-18 41 views
-3

我想知道是什么类型的文件用于阿帕奇星火,例如(CSV,TXT等)来承载数据什么类型的

+0

顺便说一下,Hadoop标签并不是真的必要,因为Spark可以在没有HDFS和YARN的情况下工作 –

回答

0

fileStream可以接受任何类型的文件作为用于Apache的火花流媒体文件只要您可以提供可将其转换为记录的输入格式类即可。有用的输入应该是可分解的,并且不需要阅读整个文件就可以轻松解析,但只要您能够接受性能损失就不一定要有。