2012-06-23 53 views
2

我想将基于Hadoop的Mahout推荐器与Apache Hive结合使用。因此,我生成的建议书直接存储在我的Hive表格中......任何人都知道类似的教程。Mahout Hive集成

回答

7

基于Hadoop的Mahout推荐器可以直接在HDFS中存储结果。

Hive还允许您使用CREATE EXTERNAL TABLE recommend_table在任何数据之上创建表格架构,该架构还指定数据的位置(LOCATION '/home/admin/userdata';)。

通过这种方式,您可以确保在将新数据写入该位置时 - /home/admin/userdata那么它已经可用于Hive,并且可以通过现有的Table模式:recommendation_table查询。

我曾经在一段时间内对它进行了博客:external-tables-in-hive-are-handy。此解决方案有助于任何类型的map-reduce程序输出,需要立即为Hive特设查询提供。

+0

如果我想通过从Hive读取数据目录(即通过HQL)执行Mahout分析,那么该怎么办?我所有的表都是外部表格。谢谢。 – Kevin