我有一个系统,每行生成100,000行,每行的大小为1KB,并希望使用Cassandra进行数据库。 我从Apache Kafka获取数据,然后将其插入数据库。 将此卷数据加载到Cassandra的最佳方式是什么?Cassandra大容量加载数据
回答
卡夫卡连接是专为此设计的。在此页面上,您可以找到包含Cassandra水槽连接器的连接器列表https://www.confluent.io/product/connectors/
我从kafka获取CSV邮件。看起来连接器使用avro格式。我真的吗? –
不确定有关CSV邮件,但json除了avro还可以使用: http://docs.datamountaineer.com/en/latest/cassandra-sink.html#legacy-topics-plain-text-payload-with-a -json-string 老实说,写一些像流应用程序这样的东西可能会更容易将CSV转换为json或avro,然后将其写入可以拉入Cassandra的新主题。您也可以编写自己的CSV转换器或尝试使用Kafka附带的StringConverter。不知道这将如何与Cassandra一起工作,但这些选项中的任何一个都比编写自己的完整应用程序更容易。 – dawsaw
从CSV到JSON或AVRO的数据转换可以在一个小的Apache CAMEL模块中轻松实现。它支持Kafka连接,所以你可以从Kafka中读取,转换并回写到@dawsaw提到的Kafka。您还可以根据需要对其进行缩放。 – Gautam
- 1. Cassandra大容量加载 - NoHostAvailableException
- 2. 加载大量数据
- 3. 加载大数据集的Java(ArrayList中的最大容量)
- 4. Cassandra:大容量传感器数据说明
- 5. 向cassandra插入大量数据
- 6. 大容量加载数据转换错误
- 7. 大容量加载数据转换错误
- 8. 加载大量数据/内容时网页滚动缓慢
- 9. Silverlight的 - 无法加载大量数据
- 10. 在后台加载大量数据
- 11. 使用Node.js的大量数据加载
- 12. 加载大量的JSON数据
- 13. 加载大量的excel数据与EPPlus
- 14. Django灯具,加载大量数据
- 15. 加载和分析大量数据
- 16. Datagrid中加载大量数据的
- 17. 帮助加载大量数据
- 18. 如何加载大量数据?
- 19. 将大量数据加载到Postgres Hstore
- 20. cassandra python数据加载失去连接
- 21. Cassandra加载数据不正确
- 22. 什么是Cassandra的良好批量数据加载工具
- 23. HBase大容量加载jar问题
- 24. GREG服务大容量加载
- 25. SQL Server大容量插入“批量加载数据转换错误”
- 26. Cassandra数据存储大小
- 27. Cassandra - 批量过大
- 28. Cassandra超时cqlsh查询大量(ish)数据量
- 29. 将大量数据加载到Oracle SQL数据库中
- 30. 从Android中的Sqlite数据库加载大量的数据
将数据拆分成批。最好批量大小为1000,并将数据写入cassandra db。 – kai