我从我的映射输出中:的MapReduce,排序的值
Mapper: KEY, VALUE(Timestamp, someOtherAttrbibutes)
我减速确实收到:
Reducer: KEY, Iterable<VALUE(Timestamp, someOtherAttrbibutes)>
我想Iterable<VALUE(Timestamp, someOtherAttrbibutes)>
由时间戳下令属性。有没有可能实施它?
我想避免手动排序Reducer代码。 http://cornercases.wordpress.com/2011/08/18/hadoop-object-reuse-pitfall-all-my-reducer-values-are-the-same/
我将不得不从“Iterable”“深度复制”所有对象,这可能会导致巨大的内存开销。 :(((
我读过这篇文章的,漂亮的同样是在Hadoop中所描述的,defenitive指南3.我的理解,我必须移动我的T imestamp属性键和键组合:[EXISTING_KEY_VALUE,Timestamp_attr_from_value]。如果是的话,我不喜欢这种方法。对我来说,这对我的业务并不自然,可以混淆其他开发者...... :( – Sergey
+1 - 这是最好的方法,对不起! –
好的,我会做的。谢谢... – Sergey