我使用猪加载使用CqlStorage从卡桑德拉数据。我有4个数据节点,每个节点可以有7个映射器,在Cassandra中有大约3000万个数据。当我运行像这样增加映射器在猪
LOAD 'cql://keyspace/columnfamily' using CqlStorage
需要27名映射器来运行。
但是,如果我给where子句中负载的功能就像
LOAD 'cql://keyspace/columnfamily?where_clause=id%3D100' using CqlStorage
总是需要一个映射。
任何一个可以帮助我从你在那里同样的地图输入条款只会是一个关键的增长映射
[在Hadoop中更改文件拆分大小]的可能重复(http://stackoverflow.com/questions/9678180/change-file-split-size-in-hadoop) –
这是专门针对具有where子句的CqlStorage,尽管我试图改变分割大小,但仍然只有一个映射器。 **注:只有在我包括where条款的情况下。** – Shri