有人可以解释一下MapReduce如何与Cassandra.6搭配使用吗?我已经读过了字数统计的例子,但我并不完全了解Cassandra的结局与“客户端”的结局。如何使用Cassandra的Map Reduce或不带猪?
https://svn.apache.org/repos/asf/cassandra/trunk/contrib/word_count/
举例来说,假设我使用Python和Pycassa,我将如何加载新的地图功能降低,然后再打电话吗?我的地图缩小功能是否必须是安装在cassandra服务器上的java?如果是这样,我如何从Pycassa调用它?
还有一提到猪使这一切都更容易,但我是一个完整的Hadoop noob,所以这并没有真正的帮助。
你的答案可以使用Thrift或其他,我刚才提到Pycassa来表示客户端。我只是想了解在Cassandra集群中运行的内容与发出请求的实际服务器之间的区别。
因此,Cassandra节点不会执行map reduce操作,无论您的Java运行在哪里? – UltimateBrent 2010-04-29 22:02:25
是的,Hadoop jobtrackers运行m/r作业。 – jbellis 2010-04-30 01:35:23
所以不是地图减少它的分布点?如果它不在cassandra节点上运行,那有什么意义? – UltimateBrent 2010-04-30 20:28:14