2011-12-07 68 views
0

有什么办法可以将PDF转换为HTML吗?我需要文件中的文本,当我尝试使用PDFtoText库时,我得到了文本,但未排序,没有任何解析规则。 我注意到,一些PDFtoHTML在线服务对于该文件非常有效。那么,请提供任何提示? Here is the PDF file和我只需要在右列中的一个特定的行。在PHP中将特定的PDF文件转换为HTML

+0

http://stackoverflow.com/questions/956508/convert-pdf-to-html –

+0

你应该试试这个答案:http://stackoverflow.com/a/ 2249962/765854,并只采取你关心的部分。 –

回答

0

尝试整合poppler项目中的PDFtoHTML;应该支持表格识别。

0

pdftohtml工作正常:快速,稳定但html结果最好是丑陋的。我已经用了很长一段时间为一个有很多工作简历的网站。

然而,这是提取文本内容的好方法。

我会给scribd API试试

http://www.scribd.com/developers/api

或谷歌应用程序文件API。 GOogle做了一个很棒的工作显示和转换PDF文件

+0

来源:stackoverflow.com/questions/956508/convert-pdf-to-html –