回答

0

不,但如果我是对的,你可以重新处理你的数据。这将覆盖部分写入。在写入Cassandra时,当您尝试使用相同主键插入数据时,会使用一种更新(upsert)。

2

否.Spark(和Cassandra就此而言)不会基于整个任务执行提交样式插入。这意味着你的写作必须是幂等的,否则你最终会出现奇怪的行为。

+0

有关如何使它们具有幂等性的任何输入?我面临的问题与cassandra表中的重复记录与任务之间的故障之间,并从头开始重新启动任务 –

+0

大家好,任何投入就此? –

+0

确保你没有写入重试时改变的内容。警惕非幂等操作(添加到列表和地图)。基本幂等事物。无论代码执行多少次,您都应该保持一致。 – RussS