2013-03-12 73 views
1

这是我的问题:我的组织希望将用户的Word文档上传到服务器。在服务器端,需要将文档(用样式强制执行)转换为XML格式文件。接下来,我需要使用php来解析打开的xml格式文件并将内容放入数据库中。有谁知道如何在服务器端自动将单词转换为XML?是否有任何API或示例代码用于解析Open XML格式的PHP?您的建议表示赞赏。Word到XML转换

+4

较新版本的Word(.docx)和OpenOffice的.odt格式已经*为* XML。将其中的一个重命名为.zip并查看 – 2013-03-12 13:25:31

+0

检查此问题:http://stackoverflow.com/questions/5052292/php-read-and-write-in-ms-word – Anas 2013-03-12 13:28:47

+0

谢谢@Pekka웃我试过保存* .xml作为选项,但它为一个简单的word文档生成大量的xml代码,其中包括该单词的所有字体和其他属性。 – nani1216 2013-03-12 14:00:07

回答

1

你看过使用VBA

我不得不做类似的工作,我在WSF或VBS文件中使用了VBA。如果您的服务器是Windows环境,它将从操作系统运行。您可以从PHP执行此操作(不推荐),也可以将Docx文件放到Web服务器环境以外的常用文件夹中。自Web服务器环境以来,我推荐后者。可以引入安全问题。

另一个需要注意的地方是,如果你想从样式中分离内容,你需要对输出标记进行一些后期处理。 Word是一个“字”处理器,所以它的设计就是它的样式。如果这是一项要求,我会建议转而使用基于XML的结构化创作工具。

希望这会有所帮助!