2013-06-11 39 views
1

我有很多不同版本的Word文档,必须将其转换为文本文件。
我希望这个链接为您带来正确的方式 How to extract text from Word files using C#? 我想阅读word文档的内容并删除所有格式(只是在文本文件中有文字)。我已经通过使用microsoft.office.interop(这里,总是在客户端实例化一个Word)完成,这是不推荐的。所以我想创建一个C#项目,它应该自动将单词转换为文本。任何人都可以建议我任何第三方工具,应该是有效的开源或合理的价格的所有版本的单词到文本文件在C#中的转换?如何在不使用microsoft.office.interop的情况下将word文档转换为c#中的文本文件?

与问候, Shanthini

+0

我看希望看到回答了。 –

+1

单词只是皮肤下的xml文件。将.doc更改为.zip并将其解压并查看,但是您会在此处看到一个非常深的兔子洞。 – deltree

+0

你想复制多少个文件?如果数量很大,那么第三方可能会更好,但是如果不是,您可能需要查看文件撰写器和Streamwriter,在其中复制word文档,创建一个新的.txt文件并将该字符串粘贴到txt文件中。 –

回答

1

终于让我找到解决方案的时刻,其完全为我工作。我没有测试10000个文件。在这里,您去,http://sourceforge.net/projects/word-reader/?source=dlp 意见和建议都期待这个解决方案...

谢谢 Shanthini

+0

很遗憾,没有附带源代码,即使它被托管在源代码上 –

+0

如果你想用大量文件类型(不只是MSWord)来做到这一点,请参阅http://stackoverflow.com/a/41091943/495455 –

相关问题