在我们的一个项目中,我们使用Kafka和AVRO在应用程序之间传输数据。数据被添加到AVRO对象,并且对象被二进制编码以写入Kafka。我们使用二进制编码,因为它与其他格式相比通常被称为最小表示。AVRO压缩数据的二进制编码?
的数据通常是一个JSON字符串,当它被保存在一个文件,它使用到磁盘上的10 MB。但是,当文件被压缩(.zip)时,它只使用几个KB。我们关心的是将这些数据存储在Kafka中,所以在写入Kafka话题之前试图压缩。
当被测量的二进制编码消息(即字节数组的长度)的长度,它正比于数据串的长度。所以我认为二进制编码不会缩小任何尺寸。
有人可以告诉我,如果二进制编码压缩数据?如果不是,我该如何应用压缩?
谢谢!