2014-09-04 205 views
1

早安批量加载,错误与卡桑德拉

我试图使用大容量装载(http://www.datastax.com/dev/blog/bulk-loading)为指导,以实现海量数据的转储卡桑德拉例子。

在该示例解决与脚本(http://www.datastax.com/wp-content/uploads/2011/08/DataImport)的依赖关系,但我发现cassandra库不包含在这里列出的目录中的依赖项,因为我正在与cassandra 2.0一起使用dse。那么试图覆盖这样的依赖关系获得以下脚本。

#!/bin/sh 

# paths to the cassandra source tree, cassandra jar and java 

CASSANDRA_HOME="/usr/share/dse/cassandra" 
# CASSANDRA_JAR="./apache-cassandra-2.0.10.jar" 
JAVA=`which java` 

# Java classpath. Must include: 
# - directory of DataImportExample 
# - directory with cassandra/log4j config files 
# - cassandra jar 
# - cassandra depencies jar 
CLASSPATH=".:/usr/share/dse/dse.jar:./slf4j-1.7.7/slf4-nop-1.7.7.jar:./slf4j-1.7.7/slf4j-simple-1.7.7.jar:/etc/dse/cassandra" 

for jar in $CASSANDRA_HOME/lib/*.jar; do 
    CLASSPATH=$CLASSPATH:$jar 
done 

$JAVA -ea -cp $CLASSPATH -Xmx256M \ 
     -Dlog4j.configuration=log4j-tools.properties \ 
     CassandraDataBulk "[email protected]" 
  • CASSANDRA_JAR被注释掉,我用 “卡桑德拉 - 全2.0.8.39.jar” 所在的文件夹中的 “在/ usr /共享/ DSE /卡桑德拉/ lib目录”,并已被包括在内。

  • 我解决了在1.7.7版本下载slf4j依赖关系。

由于cassandra版本的不同,我还不得不习惯使用SSTableSimpleUnsortedWriter构建器。

IPartitioner partitioner = new RandomPartitioner(); 

     SSTableSimpleUnsortedWriter sourcesWriter = new SSTableSimpleUnsortedWriter(
       directory, 
       partitioner, 
       keyspace, 
       table, 
       AsciiType.instance, 
       null, 
       64 
     ); 

看来现在的问题是仍然存在依赖关系。 下,我得到的跟踪错误。

有一个依赖,但它似乎是“org.apache.commons.configuration.ConfigurationRuntimeException”真正的问题可能是另一个,可能有一个不好的配置“cassandra.yaml”?

谢谢, 问候!

[[email protected] ~]$ ./init_env.sh export.csv 
[main] ERROR org.apache.cassandra.cql3.QueryProcessor - Unable to initialize MemoryMeter (jamm not specified as javaagent). This means Cassandra will be unable to measure object sizes accurately and may consequently OOM. 
[main] INFO org.apache.cassandra.config.YamlConfigurationLoader - Loading settings from file:/etc/dse/cassandra/cassandra.yaml 
[main] INFO org.apache.cassandra.config.DatabaseDescriptor - Data files directories: [/data01, /data02] 
[main] INFO org.apache.cassandra.config.DatabaseDescriptor - Commit log directory: /datatmp/commitlog 
[main] INFO org.apache.cassandra.config.DatabaseDescriptor - DiskAccessMode 'auto' determined to be mmap, indexAccessMode is mmap 
[main] INFO org.apache.cassandra.config.DatabaseDescriptor - disk_failure_policy is stop 
[main] INFO org.apache.cassandra.config.DatabaseDescriptor - commit_failure_policy is stop 
[main] INFO org.apache.cassandra.config.DatabaseDescriptor - Global memtable threshold is enabled at 61MB 
[main] INFO com.datastax.bdp.snitch.Workload - Setting my workload to Cassandra 
Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/commons/configuration/ConfigurationRuntimeException 
    at com.datastax.bdp.config.ConfigUtil.defaultValue(ConfigUtil.java:18) 
    at com.datastax.bdp.config.DseConfig.<clinit>(DseConfig.java:51) 
    at com.datastax.bdp.snitch.DseDelegateSnitch.<init>(DseDelegateSnitch.java:42) 
    at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method) 
    at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:57) 
    at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45) 
    at java.lang.reflect.Constructor.newInstance(Constructor.java:526) 
    at java.lang.Class.newInstance(Class.java:374) 
    at org.apache.cassandra.utils.FBUtilities.construct(FBUtilities.java:488) 
    at org.apache.cassandra.config.DatabaseDescriptor.createEndpointSnitch(DatabaseDescriptor.java:508) 
    at org.apache.cassandra.config.DatabaseDescriptor.applyConfig(DatabaseDescriptor.java:341) 
    at org.apache.cassandra.config.DatabaseDescriptor.<clinit>(DatabaseDescriptor.java:111) 
    at org.apache.cassandra.io.sstable.AbstractSSTableSimpleWriter.<init>(AbstractSSTableSimpleWriter.java:50) 
    at org.apache.cassandra.io.sstable.SSTableSimpleUnsortedWriter.<init>(SSTableSimpleUnsortedWriter.java:96) 
    at org.apache.cassandra.io.sstable.SSTableSimpleUnsortedWriter.<init>(SSTableSimpleUnsortedWriter.java:80) 
    at org.apache.cassandra.io.sstable.SSTableSimpleUnsortedWriter.<init>(SSTableSimpleUnsortedWriter.java:91) 
    at CassandraDataBulk.main(CassandraDataBulk.java:35) 
Caused by: java.lang.ClassNotFoundException: org.apache.commons.configuration.ConfigurationRuntimeException 
    at java.net.URLClassLoader$1.run(URLClassLoader.java:366) 
    at java.net.URLClassLoader$1.run(URLClassLoader.java:355) 
    at java.security.AccessController.doPrivileged(Native Method) 
    at java.net.URLClassLoader.findClass(URLClassLoader.java:354) 
    at java.lang.ClassLoader.loadClass(ClassLoader.java:425) 
    at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:308) 
    at java.lang.ClassLoader.loadClass(ClassLoader.java:358) 
    ... 17 more 

回答

0

您在java调用中缺少“javaagent”参数。添加以下内容:

-javaagent:$CASSANDRA_HOME/lib/jamm-0.2.5.jar 

你的最后调用应该是这样的:

$JAVA -ea -cp $CLASSPATH -Xmx256M \ 
     -Dlog4j.configuration=log4j-tools.properties \ 
     -javaagent:$CASSANDRA_HOME/lib/jamm-0.2.5.jar 
     CassandraDataBulk "[email protected]" 

注:调整路径所必需的jamm.jar

Reference

至于运行时配置错误,请下载apache commons'lang'库并将其包含到您的类路径中。

Download here

如果收到执行修复后新的异常,下载谷歌-common.jar和番石榴16.0.1.jar,包括他们以及到类路径中。这些都是我自己的批量加载器到目前为止所需的所有JAR。

+0

谢谢!这个解决方案修复了我的第一个错误。 '[main] ERROR org.apache.cassandra.cql3.QueryProcessor - 无法初始化MemoryMeter(jamm未指定为javaagent)。这意味着卡桑德拉将无法准确测量物体的大小,并可能因此OOM.'但不幸的是,我仍然有像昨天一样的异常 – 2014-09-05 08:16:54

+0

而另一个例外是什么?我在原始帖子中只看到一个堆栈跟踪。编辑:没关系。我意识到异常跟踪与jamm警告是分开的问题。当我找到解决方案时,我将编辑我的答案 – 2014-09-05 08:32:05

+0

针对我的答案添加了针对例外的解决方案。测试它是否有效(我没有亲自测试,但这是我从写自己的散装装载机的经验中记得的) – 2014-09-05 08:38:56