当您打开Word时,它允许您保存为Word Open XML格式。我已经看到有关打开docx文件作为zip文件,然后从那里提取的东西的帖子。但我真正想要的是将docx转换为单个XML的方式,就像在MS Office中执行“另存为”操作时一样。该怎么办?如何将Doc/Docx自动转换为单个XML文件?
以及如何为.doc格式执行此操作?
注:我想以编程方式做到这一点。最好在Linux开发条件下使用PHP。但是,如果这不可用,那么其他语言将会这样做。最后,如果涉及到它,我可以考虑启动一个Windows服务器来做到这一点。
有没有办法做到这一点没有interop?例如,作为docx的zip包 - 它是否具有某种模式,可用于合并与单一文件XML完全相同的内容? – samxli 2012-08-13 15:21:50
对不起,它被标记为office-interop,所以我假设。另外,不确定您是否能够在服务器场景中使用Interop,可能需要检查其他线程。 ||这听起来像是你想要每个构成一个WordprocessingDocument对象的包/零件,但是它们都在一个统一的包/零件中。 – JohnZaj 2012-08-13 21:40:29
谢谢你。我试图使用wdFormatOpenDocumentText来保存一个.docx文件,并得到一个COM异常。 – GrandMasterFlush 2012-09-20 10:04:30