我们已经编写了一个Java代码,我们正试图将PDF转换为Bytearray。PDF转ByteArray转换
但问题是,当我们尝试转换并尝试打印转换的输出时,我们只能得到8到10个字符。为什么?当我转换整个PDF文件时,它必须是大量的字符。
这里是我的代码:
public static void main(String[] args)
{
FileInputStream in = new FileInputStream(new File("C:\\test\\P12.pdf"));
FileOutputStream out = new FileOutputStream(new File("C:\\test\\pdfoutput.xml"));
byte[] buffer = new byte[1024];
ByteArrayOutputStream bs = new ByteArrayOutputStream();
int bytesRead;
while ((bytesRead = in.read(buffer)) != -1)
{
bs.write(buffer, 0, bytesRead);
}
System.out.println(in);
byte[] bytes = bs.toByteArray();
System.out.println(bs.toString());
out.write(bytes);
}
这里没有转换。您已将PDF文件读取到一个字节数组中。它仍然是PDF格式。不能用'println()打印' – EJP
你的问题有点不清楚。你想从PDF中提取所有文本数据吗? – Robert
不,我不想读取所有文本数据..只是简单的PDF - > ByteArray格式就是这样。您能否让我知道我需要在哪里更改代码 –