2012-08-07 105 views
4

集成Cassandra和Hive的最佳实践是什么?Cassandra - Hive集成

Stackoverflow上的一个老问题(Cassandra wih Hive)指向了Brisk,它现在已经成为仅限订阅的Datastax Enterprise产品。

谷歌搜索仅指向两个开放JIRA问题,

,但它们都没有导致致力在两个项目之一的任何代码。

将Cassandra和Hive修补Cassandra/Hive源代码的唯一方法是整合Cassandra和Hive吗?你在堆栈中使用哪种解决方案?

回答

1

我在一个月前做了同样的研究,得出了同样的结论。 Brisk不再可用作社区下载,除了修补Cassandra/Hive代码之外,在Cassandra数据库中抛出map/reduce作业的唯一方法是使用DSE - Datastax Enterprise,我相信这是免费使用的但生产集群。

你可能会看看HBase这是基于HDFS

-1

您可以针对此问题使用集成框架或集成套件。查看我的演示文稿“Big Data beyond Hadoop - How to integrate ALL your data”,了解有关如何使用Hadoop开源集成框架和集成套件的更多信息。例如,Apache Camel(集成框架)和Talend Open Studio for Big Data(集成套件)是两种开源解决方案,它们提供Cassandra和Hadoop的连接器。