我有很多不同版本的Word文档,必须将其转换为文本文件。
我希望这个链接为您带来正确的方式 How to extract text from Word files using C#? 我想阅读word文档的内容并删除所有格式(只是在文本文件中有文字)。我已经通过使用microsoft.office.interop(这里,总是在客户端实例化一个Word)完成,这是不推荐的。所以我想创建一个C#项目,它应该自动将单词转换为文本。任何人都可以建议我任何第三方工具,应该是有效的开源或合理的价格的所有版本的单词到文本文件在C#中的转换?如何在不使用microsoft.office.interop的情况下将word文档转换为c#中的文本文件?
与问候, Shanthini
我看希望看到回答了。 –
单词只是皮肤下的xml文件。将.doc更改为.zip并将其解压并查看,但是您会在此处看到一个非常深的兔子洞。 – deltree
你想复制多少个文件?如果数量很大,那么第三方可能会更好,但是如果不是,您可能需要查看文件撰写器和Streamwriter,在其中复制word文档,创建一个新的.txt文件并将该字符串粘贴到txt文件中。 –