2013-04-25 106 views
3

我想从MS Word文档中提取文本信息。提取的信息包含文本的位置,页码和样式。有没有人可以建议我我该怎么做?什么图书馆可以支持我这样做? 谢谢从MS Word中提取文本信息

回答

1

我建议你使用OpenXML SDK版本2.0。您可以查看下面的博客以了解如何知道提取内容。约OpeXML SDK http://blogs.msdn.com/b/ericwhite/archive/2009/02/16/finding-paragraphs-by-style-name-or-content-in-an-open-xml-word-processing-document.aspx

或者更多的信息:

http://msdn.microsoft.com/en-us/office/aa905545.aspx

有了这个库,你不需要在计算机上安装MS Word中提取内容或产生新的Word文档。

希望得到这个帮助。

+0

好的非常感谢你 – Rose 2013-04-25 04:45:33