2012-03-22 37 views
-1

我想使用C#提取MS Office文件的内容。 例如:我想打开一个doc/docx/xls/xlsx/ppt/pptx并且能够提取文本和信息,例如(页数 - 单词,页数 - excel,幻灯片数 - ppt,数字图表 - excel,图片数量 - powerpoint等等)等等)。 我意识到我可以使用Windows iFilter提取文本。但是这只给了我文字。任何人都知道可以给我这种信息的DLL或东西?如果没有,是否有任何网站可以详细解释办公室xml文件的骨架?提取MS Office属性

回答

1

对于DOCX/XLSX/PPTX MS报价一个免费的图书馆叫做OpenXML SDK,你可以用它来实现你所要求的...

对DOC/XLS/PPT(年长/二进制)我不知道一个免费图书馆 - 有支持此部分商业库:

商业库通常提供了非常丰富的功能 - 例如导出为PDF ...

+0

这也许是个不错的选择。也许我可以通过编程将文档更改为docx,然后调用OpenXML SDK。 – nunoaac 2012-03-23 10:22:43