2015-08-25 136 views
1

目前我正在使用Cassandra 2.1.5,Hive 1.2.1和Hadoop 2.7.1。我尝试使用本教程卡桑德拉连接成蜂巢:将Cassandra与Hive连接

http://frommyworkshop.blogspot.com/2013/09/real-time-data-processing-with.html

但似乎我被困在创建外部表:

创建外部表test.pokes(FOO INT,酒吧字符串)存放'org.apache.hadoop.hive.cassandra.CassandraStorageHandler'WITH SERDEPROPERTIES(“cassandra.host”=“127.0.0.1”,“cassandra.port”=“9160”,“cql.primarykey”=“foo”, “comment”=“check”,“read_repair_chance”=“0.2”,“dclocal_read_repair_chance”=“0.14”,“gc_grace_seconds”=“989898”,“bloom_filter_fp_chance”=“0.2”,“compaction”=“{'class': 'LeveledCompactionStrategy'}”, “replicate_on_write”=“false”,“caching”=“all”);

,错误是这样的:

失败:执行错误,从org.apache.hadoop.hive.ql.exec.DDLTask返回码1。 org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe.initSerdeParams(Lorg /阿帕奇/ hadoop的/ CONF /配置; Ljava/util的/属性; Ljava /郎/字符串;)Lorg /阿帕奇/ hadoop的/蜂巢/ serde2 /懒惰/ LazySimpleSerDe $ SerDeParameters;

有谁知道如何解决这个问题?

+0

您是否发现问题? – Claudio

回答

2

修复这个hive-cassandra存储处理程序问题可能很乏味。

您在shell上发现的错误日志可能并不总是有帮助。

请参阅大部分位于/tmp/<user-id>/hive.log的配置单元日志文件,以获取有关故障的实际详细错误消息。

晴的原因可能是因为错误的Cassandra的主机名/端口,密钥空间,关键的conf等

希望这有助于中。

0

来自2013博客的关于Hive和Cassandra的信息已过时。例如,'org.apache.hadoop.hive.cassandra.CassandraStorageHandler'前一段时间被'org.apache.hadoop.hive.cassandra.cql3.CqlStorageHandler'取代。我想你需要使用DSE的configure BYOH