1
我正在尝试阅读word文档。 我能够使用openXml读取.docx文件,但出现错误如何在.net中读取.doc和.docx文件而不使用interop,openxml或Aspose?
文件包含损坏的.doc文件数据。
我不想像aspose这样的付费图书馆,它也应该工作,如果没有安装word。
我正在尝试阅读word文档。 我能够使用openXml读取.docx文件,但出现错误如何在.net中读取.doc和.docx文件而不使用interop,openxml或Aspose?
文件包含损坏的.doc文件数据。
我不想像aspose这样的付费图书馆,它也应该工作,如果没有安装word。
选项1是写自己的库来解决这个问题。建议不要采用这个选项,因为这将变成比你正在研究的项目更大的项目。
选项2
我不希望像阅读Aspose任何付费库并且如果没有安装Word它应该工作。
您可以使用Syncfusion docio。如果您符合条件,则有免费许可here。我们正在使用它来进行文档相关的解析。我们对图书馆感到满意。
你可以写自己的解析器,然后。 – Steve
感谢您的回复,但您可以提供任何示例吗?这将是对我有帮助 –
自己编写解析器老'.doc'文件是一个相当艰巨的任务,因为该格式是相当复杂的AFAIK。因此,对于Stack Overflow的答案来说,任何一种示例都会太多。所以我想,除非你找到某种自由库是能够编辑老'.doc'文件(我不知道任何),你很可能需要寻找到一些市售库,如阅读Aspose,或使用互操作来读取这些文件(或只是支持'.doc'文件并坚持OpenXML和'.docx'文件)。 – bassfader