2014-10-09 107 views
-1

我正在尝试用C#读取Word文件。我只需要word文档中的文本。在C中读取DOC和DOCX文件#

我正在使用NetOffice库。如果机器上安装有Micorsoft Word,则工作正常,但如果未安装MS Word,则会引发异常。

错误:“Word.ApplicationNetOffice PROGID没有找到Word.Application在NetOffice.COMObject.CreateFromProgId(字符串PROGID)”

我猜,这并不工作,因为NetOffice使用互操作操纵Word文件。是否有任何可以读取DOC或DOCX文件的开源库(或者一个DOC用于一个库,另一个用于DOCX)?

+0

从ASP.NET或其他服务器技术中使用Office Interop是一个可怕的想法。这些API被编写用于桌面应用程序,用于自动化Office(一套桌面应用程序)。服务器应用程序在许多方面有所不同,因此在其中使用Office Interop是非常非常糟糕的主意。它也不受Microsoft的支持,并可能违反您的Office许可证。请参阅[服务器端自动化办公室的注意事项](http://support.microsoft.com/kb/257757) – 2014-10-09 18:15:03

+0

是的,我明白这一点。有解决方案吗?我无法找到任何用于阅读DOC文件的开源库。 – Programmer 2014-10-09 18:23:29

+0

如果您找到这样的图书馆,我会感到惊讶,因为DOC是一种专有格式。 – 2014-10-09 18:49:32

回答

3

OpenXML SDK是免费提供的,支持.docx和其他office 2007+格式。

Aspose.Words是商业的,但确实提供了对.doc文件(等等)的支持。

相关问题