2016-04-27 30 views
1

我们使用Prediction.IO作为我们的推荐引擎。从Prediction.io批量导出分数

部署后(pio deploy),我们可以调用部署后创建的Web服务,以便在需要时一次获得一个用户的推荐结果。我们还可以通过一次呼叫向很多用户发送很多请求。

因为我们拥有数十亿的事件和数百万的用户实体,所以使用http端口的Web服务不是一种快速的方式来导出数据并对其进行分析,比如在Hive中。

问题是,我们无法找到一种方法来为所有用户导出推荐(让我们假设每个用户有10条建议)。

有一个命令(pio export)导出所有的事件数据,但是这不包含得分值或推荐结果。

想要找到批量导出结果的方法吗?

回答

0

经过一些研究发现PredictionIO网站上的this;

本教程将解释如何使用$ pio eval来保存一批查询的预测结果。请阅读评估以首先了解DataSoure的readEval()和评估组件的用法。

另外;

本教程基于一些实验和开发人员特性,这些特性可能会在将来的版本中进行更改。