我在Linux服务器上,我需要的MS Word 97-2003 .doc格式转换为纯文本.TXT使用PHP文档转换为txt
文件我已经尝试过这样的解决方案:
How to extract text from word file .doc,docx,.xlsx,.pptx php
Extract text from doc and docx
但都只是工作正常进行的.docx格式。
问题是当我转换文件时,我在文本的末尾有废品字符。 我不需要的字符长度取决于文件的长度。 此外,它可能会发生,如果该文件有点长,它会被截断。
有没有简单的方法来获得这个转换?
简单:没有..... – kero
嗯,简单的我意思是没有使用外部应用程序,如Apache POI或其他Java的东西或Antiword ... –
你总是需要一个库,因为PHP本身不支持这个 – kero