2013-02-18 42 views
1

我正在寻找一个工具或流程来导出facebook页面和Facebook应用的facebook洞察数据。目前我只是从他们的Insights界面手动下载csv文件,但理想情况下,我想自动执行此过程并将数据加载到Pentaho Kettle中,以便对数据执行一些操作。自动下载facebook洞察数据

有什么方法可以自动下载和输入CSV文件?或者我将不得不使用Facebook图形API的资源管理器?我目前正在查看一个设置,我使用NetBeans和RestFB来提取我想要的数据,然后使用Pentaho Kettle访问这些数据。我不确定这是否会起作用,或者如果这是最好的方法。

+0

不确定接口是如何工作的,但我曾经认为Pentaho Kettle可以直接获得它。如果它不能,你总是可以写一个插件,这可能最终会使用RestFB?编写插件有很多好的doco,如果你回馈社区,你可能也会得到很多帮助。 – Codek 2013-02-19 16:25:45

回答

0

正如Codek所说,Kettle插件是一个非常好的主意,对Kettle项目非常有用。不过,这也是一项认真的努力。

如果您不想付出这种努力,只要通过标准传输方法(FTP,SFTP,SSH等)提供文件,就可以使用Kettle作业下载文件。我从来没有使用RestFB,所以我不知道有什么可用的。您可能可以直接从Web服务中获取REST客户端转换步骤。

下载文件后,您可以将它们发送到要加载的转换。你可以用执行每个输入行来做到这一点?“选项,或者您可以从从结果中获取文件,从变换中的作业结果集中获取文件名。

然后,您可以在加载复制或移动结果文件名后归档文件。在一份工作中,我发现只有文件不在我的档案中使用获取文件名合并加入,然后设置文件中的结果步进一个转换,这样如果需要也可以完成。

要使其自动化,您可以使用Kitchen.bat/Kitchen.sh从调度程序运行作业。由于我使用PostgreSQL很多,我使用PGAgent作为我的调度程序,但Windows调度程序或cron也是如此。

希望有所帮助。

+0

写一个水壶插件是一块蛋糕,有很多的例子。鉴于原始的海报已经在谈论编码这个特定的部分无论如何,我确信他们可以处理它! – Codek 2013-02-24 18:53:57

+0

我相信他们也可以。我只是想说一个插件比一个转换/作业更有效。我同意,虽然有一个步骤将是水壶的一个很好的补充。 – 2013-02-27 23:43:41