我有一些大的base64编码数据(存储在hadoop文件系统中的snappy文件中)。 此数据最初是经过gzip压缩的文本数据。 我需要能够读取此编码数据的块,对其进行解码,然后将其刷新到GZIPOutputStream。Base64数据流解码
关于如何做到这一点,而不是将整个base64数据加载到数组并调用Base64.decodeBase64(byte [])的任何想法?
我是对的,如果我读取字符直到'\ r \ n'分隔符并逐行解码它? 例如:
for (int i = 0; i < byteData.length; i++) {
if (byteData[i] == CARRIAGE_RETURN || byteData[i] == NEWLINE) {
if (i < byteData.length - 1 && byteData[i + 1] == NEWLINE)
i += 2;
else
i += 1;
byteBuffer.put(Base64.decodeBase64(record));
byteCounter = 0;
record = new byte[8192];
} else {
record[byteCounter++] = byteData[i];
}
}
不幸的是,这种方法没有给出任何人类可读的输出。 理想情况下,我想流式读取,解码和流出数据。
现在,我试图把在一个InputStream,然后复制到gzipout
byteBuffer.get(bufferBytes);
InputStream inputStream = new ByteArrayInputStream(bufferBytes);
inputStream = new GZIPInputStream(inputStream);
IOUtils.copy(inputStream , gzipOutputStream);
,它给了我一个 产生java.io.IOException:腐败GZIP拖车
'byteBuffer.put(Base64.decodeBase64(记录));' 不应认为是'byteBuffer.put(Base64.encodeBase64(记录));' –
的 '记录' 是Base64编码。我试图获取解码数据并将其添加到ByteBuffer。 –