2015-03-25 34 views
0

我已经用Apache flume构建了一个hadoop集群来导入twitter数据,它工作正常。从Hive连接到HDFS(JSON文件)

现在我想用twitter数据上的apache配置单元启动分析。在网上我发现了来自cloudera的下面的例子。

https://github.com/cloudera/cdh-twitter-example

但现在,在创建表,蜂巢返回以下错误信息:

java.net.URISyntaxException: Relative path in absolute URI: text:STRING, Query returned non-zero code: 1, 
cause: java.net.URISyntaxException: Relative path in absolute URI: text:STRING, 

在网上,我没有(只有靠启动蜂巢)发现了一些关于这一点,也许有人这里可以帮助我!

谢谢!

+0

你在Windows或Linux上做这个吗?我从来没有得到任何与Hadoop相关的东西在Windows上工作,如果我记得正确的话,也有类似的例外,最后我只安装了一个Fedora VM。从此顺利航行。 – blagae 2015-03-25 10:37:20

+0

即时通讯在Ubuntu上做到这一点。也许完整的命令来创建表会有所帮助? – hbenner 2015-03-25 10:39:46

回答

0

好的,第一个问题由我自己解决。忘记了命令中的分号。非常遗憾。

但是现在我在通过配置单元启动作业后收到另一个错误消息。 Hive上的所有查询作业都会在几秒钟后中止。在日志中,我发现只有这样:

2015-03-25 14:47:40,680 ERROR [RMCommunicator Allocator] org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator: Container complete event for unknown container id container_1427105751169_0006_01_000030 

任何想法在这里?