我有一个用Flask构建的Python应用程序,它允许导入许多数据记录(一次从10k-250k +记录的任何地方)。现在插入到Cassandra数据库中,一次插入一条记录,如下所示:如何高效地使用Python将批量数据插入Cassandra?
for transaction in transactions:
self.transaction_table.insert_record(transaction)
这个过程非常慢。有没有一种最佳实践方法可以用来更有效地插入此批量数据?
显而易见的事情是尝试Cassandra支持的批量插入查询。另外准备查询并重新使用它可能实际上比批量插入更快。但不要指望导入25万条记录的速度很快。也许你应该把工作委托给工人? – freakish