如何在hadoop中实现它?hadoop hive count并发性
在配置单元中,我有一个有很多列的表,其中两个是begin_time,end_time。
我需要统计每次
一块表上的数字是这样的:
begin_time end_time
2011.04.26 10:19:06^A2011.04.26 10:20:22
2011.04.26 10:19:08^A2011.04.26 10:21:49
2011.04.26 10:19:08^A2011.04.26 11:18:46
2011.04.26 10:19:09^A2011.04.26 12:08:36
2011.04.26 10:19:09^A2011.04.26 11:00:16
2011.04.26 10:19:11^A2011.04.26 10:19:17
2011.04.26 10:19:12^A2011.04.26 10:46:21
2011.04.26 10:19:13^A2011.04.26 10:55:43
2011.04.26 10:19:17^A2011.04.26 10:19:41
2011.04.26 10:19:18^A2011.04.26 10:34:41
结果我要的是有多少人是在一个特定的时间。
例如在2011.04.26 10:19:08,当然有3名游客在19:06有1人,19:08有2人。
和2011.04.26 10时19分十八秒为9,当然10但2011.04.26 10时19分17秒
为一块希望的结果一个休假
2011.04.26 10:19:06 1
2011.04.26 10:19:08 3
2011.04.26 10:19:09 5
2011.04.26 10:19:11 6
2011.04.26 10:19:12 7
2011.04.26 10:19:13 8
2011.04.26 10:19:17 9
2011.04.26 10:19:18 9
任何帮助非常感谢和欢迎。
显示您尝试过什么? –
我在c中编写了一个程序来做到这一点。但应该使用hadoop做到这一点。 – caning