5
A
回答
0
据我所知,它是而不是可能使用PHP在运行中将PDF转换为可编辑的HTML,同时保留格式。有大量的桌面应用程序,所有尝试从PDF中提取数据有时更多,有时不太可靠的结果。我会说目前这不是现实可行的,你所能做的就是使用XPDF或其他命令行工具来提取纯文本。
它可能不同于那个基于XML的新PDF格式,但我还没有真正了解这一点。
随意证明我错了,当然 - 如果有解决方案,我会非常感兴趣。
1
看一看XPDF
我想你可以在编辑器中显示它做
$text = shell_exec("pdftotext $pdffile");
作为?那么,哪位编辑? 要保留某种类型的格式信息,并假设您使用的是Web编辑器,则表示HTML编辑器,您可以将其转换为HTML。也许有其他工具可用,但由于我使用xpdf,我遇到了基于xpdf的this转换器。
基本用法
pdftohtml -noframes -c test.pdf test.html
为了得到它到你喜欢的编辑器
echo file_get_contents('test.html');
您可能需要包装内的PHP函数/类的东西。你可能想要添加安全措施和什么。
相关问题
- 1. 从PDF中提取所有内容
- 2. 从PDF中提取文本内容
- 3. 使用Adobe API提取PDF内容
- 4. 使用PHP从PDF中签名提取
- 5. 使用PHP从.pdf中提取页面
- 6. 无法使用tika从pdf文件中提取文本内容
- 7. 用PHP提取内容从标签
- 8. PHP - 从分支中提取内容
- 9. 使用jsoup从表中提取内容
- 10. 使用php提取xml文件集中的内容使用php
- 11. 使用php从大型内容中提取文本
- 12. 如何使用PHP从HTML中提取特定内容?
- 13. 从LOGSTASH读取PDF内容
- 14. 从pdf中获取html内容url(jsoup)
- 15. Phonegap从PDF文件中获取内容
- 16. Apache Tika无法从大型PDF中提取全文内容
- 17. 如何从PDF中提取指定的内容
- 18. 从PDF杂志中提取文章内容
- 19. 有没有什么办法从bash中提取pdf的内容?
- 20. 使用JSOUP提取内容
- 21. 提取内容:使用XPath
- 22. 使用PDFBox v2从PDF中提取TIFF
- 23. 使用pdfbox从PDF中提取图像
- 24. 从PDF中提取表格使用Tabula
- 25. 使用C从PDF中提取图像#
- 26. 从最内括号中提取内容?
- 27. 到PDF转换提取HTML内容,并给予选项使用PHP
- 28. Php - 上传文档,docx,pdf - 提取所有内容
- 29. 使用PHP从PDF文件中提取页面
- 30. 如何使用PHP从PDF文件中提取文本?
任何在线自定义开发的网站编辑器。 – jose