2015-02-24 59 views
5

Spark中是否有可用于将RDD绑定到REST服务的开箱即用功能?也就是说,调用Web服务并获取RDD。Spark:从REST服务创建RDD

或者是自己调用剩余服务并将结果集合转换为RDD的最简单方法?

谢谢。

+0

在这发现了什么?我正在寻找类似的地方,我想在我的Web服务上使用Spark SQL返回JSON数据。 – 2015-09-24 12:40:34

+0

没有进一步调查,但我想只是自己做(创建一个包装)...认为这并不难... – Marco 2015-09-24 18:19:14

回答

-2

你可以参考链接Spark-Jobserver

一些火花Jobserver的,我认为你正在寻找的特点是:

  • “星火即服务”:简单的REST接口的所有作业方面,上下文管理
  • 启动和停止RDD共享和低延迟作业的作业上下文;在重新启动时更改资源
  • 异步和同步作业API。同步API对低延迟作业非常有用!
  • 命名的RDD按名称缓存和检索RDD,改进作业之间的RDD共享和重用。

希望这会有所帮助。

+2

OP正在寻找一种方式来读取作为Spark的Web服务数据RDD。 – Babar 2015-03-12 22:11:56

0

我使用Jersey客户端,阅读串(每行一个COMPLE JSON文件),并以该字符串做:

val stringResponse = request.request().get(classOf[String]) 
val jsonDataset = session.createDataset[String](Seq(stringResponse)) 
// try with case class 
val parsedResponse = session.read.json(jsonDataset) 

...这会导致数据框,你可以选择的东西。

相关问题