2014-03-27 74 views
2

我在Linux服务器上,我需要的MS Word 97-2003 .doc格式转换为纯文本.TXT使用PHP文档转换为txt

文件我已经尝试过这样的解决方案:

How to extract text from word file .doc,docx,.xlsx,.pptx php

Extract text from doc and docx

但都只是工作正常进行的.docx格式。

问题是当我转换文件时,我在文本的末尾有废品字符。 我不需要的字符长度取决于文件的长度。 此外,它可能会发生,如果该文件有点长,它会被截断。

有没有简单的方法来获得这个转换?

+0

简单:没有..... – kero

+0

嗯,简单的我意思是没有使用外部应用程序,如Apache POI或其他Java的东西或Antiword ... –

+0

你总是需要一个库,因为PHP本身不支持这个 – kero

回答