2012-01-30 73 views
2

我试图将PDF文档转换为java中的单个HTML文件。大多数转换器在线将一个PDF文件转换为多个HTML文件。我想将整个PDF转换为单个HTML文件。将PDF文件转换为单个HTML文件

有什么建议吗?

+0

你想提取文本,还是格式? – 2012-01-30 09:36:46

回答

0

我认为应该可以用itext解析您的PDF文档,然后生成您的html文件。 我必须承认,我没有检查它是否可行。

3

有什么建议吗?

你可能会使用JSoup API编写一个文件,包含每个多个HTML文件的body总是写一些代码。样式表(CSS)风格&可能有点棘手(特别是如果原始HTML使用'id'元素)。


虽然我很难相信有转换器赫然出现在其“单一文件”是一个选项。我建议进一步搜索。