0
我的数据很好地按分区键组织在Cassandra上。我想检索Spark中的这些数据并保留相同的分区。检索Apache Spark中的Cassandra分区数据
我的目标是避免非常大的洗牌。
PS:我用的卡珊德拉2.1和1.5星火
我的数据很好地按分区键组织在Cassandra上。我想检索Spark中的这些数据并保留相同的分区。检索Apache Spark中的Cassandra分区数据
我的目标是避免非常大的洗牌。
PS:我用的卡珊德拉2.1和1.5星火
星火卡桑德拉连接器读取C *令牌范围为星火分区。这意味着任何给定的Cassandra分区键的所有值都将位于同一个Spark分区中。
https://academy.datastax.com/demos/how-spark-cassandra-connector-reads-data
你将不得不制定...默认情况下,这是什么样的火花卡桑德拉连接器一样。 – RussS
@RussS这就是我想知道的。 – poiuytrez