2012-02-20 104 views
2

我想将仅包含文本的pdf文件转换为html格式。 我想检索内容(文本,格式,缩进等),并将其存储在变量中,以相同的格式,排列和缩进显示。将PDF转换为PHP中的HTML库

任何人都可以推荐一个PHP类/库(不是软件工具,不需要安装),我可以使用吗?

感谢

回答

1

pdf2text给你正是它说:它从PDF文件中提取文本,它不会将其转换为HTML标记。您可能需要使用命令行实用程序或此服务的在线服务。

有Linux命令行pdftohtml工具

Poppler是另一种选择,它含有一种叫pdftohtml

效用或者如果你prepred考虑一个Java应用程序

还有一个有jPedal我会猜你想要“免费”

+0

我没有使用它们,我只是意识到它们的存在......所以我不能真正评论它们有多好,或者如何使用它们 – 2012-02-20 09:29:53

0

你可以使用FPDI-PDF-Parser(COMERCIAL)来导入你的pdf文件les或FPDI(免费)导入像PDF模板(你不能修改免费版本的文本)。或者您可以存储一些HTML格式的模板和简码,并使用TCPDF创建新的PDF:开源PHP类。

+0

我猜FPDI在生成PDF而不是阅读它。我想要的是读取pdf文件的内容(文本)并将其存储在一个php变量中,并以pdf格式显示相同的格式(粗体,斜体,缩进等)。 – 2012-02-21 02:31:18