2014-10-31 25 views
1

我是新来卡桑德拉分贝,我想从一个CSV文件导入到Cassandra的数据导入,我执行以下命令,导入表,第一,我创​​建使用卡桑德拉复制命令将只有部分数据

create table cdma_mkt_bte(date_value timestamp主键,region varchar,vendor varchar);

,然后使用

拷贝cdma_mkt_bte(DATE_VALUE,区域,供应商)复制从与HEADER = TRUE '的/ usr /共享/ DSE/bin中/ cdma_mkt_bte';

问题是在csv文件中的表有大约43,000行,而只有211行被导入到卡桑德拉,我看着211和212行,看看是否有奇怪的事情发生,似乎是好的。你能帮我么?以及将csv导入cassandra数据库的其他选项有哪些。

谢谢!非常感谢帮助!

+0

我得到了同样的问题... – Robert 2014-10-31 16:18:40

回答

0

您的主键似乎是date_value。 cassandra中的所有插入和更新实质上都是主键上的插入。如果两个记录具有相同的主键,则第二个记录将覆盖第一个记录。如果以唯一标识记录的方式是DATE_VALUE +区域+供应商,那么你的架构应该想:

create table cdma_mkt_bte (date_value timestamp, region varchar, vendor varchar, 
primary key (date_value, region, vendor)); 

这可能是你没有得到记录的预期数量的原因是什么?