我需要知道如何解析Spark中的XML文件。我正在接收来自kafka的流式数据,然后需要解析流式数据。解析Apache Spark中的XML数据
这里是我的星火代码接收数据:
directKafkaStream.foreachRDD(rdd ->{
rdd.foreach(s ->{
System.out.println("&&&&&&&&&&&&&&&&&" +s._2);
});
和结果:
<root>
<student>
<name>john</name>
<marks>90</marks>
</student>
</root>
如何通过这些XML元素?
您是否搜索过此前的问题?如:http://stackoverflow.com/questions/33078221/xml-processing-in-spark –
@Binary Nerd,谢谢你的回应。我的火花应用程序正在逐行读取数据。所以我需要逐行解析,而不使用开始元素和/或结束元素。 – user6325753