我想了解如何在Word文档打开时重建Word文件,以及在保存编辑和关闭文件时以何种格式对它们进行序列化。你可能有任何信息对我非常有用?谢谢是否所有MS Word文档都以XML可读格式进行序列化?
回答
所有.doc文件存储在binary format。打开和操作这些是PAIN的练习。
所有.docx文件实际上是以ZIP格式存储的XML文件的集合。没错,只需将.docx或.xmlx或.pptx的扩展名更改为.ZIP,就可以像打开其他任何ZIP文件一样打开文件。 MS甚至有一个称为Office Open XML的格式的API。就我个人而言,我认为OOXML API具有相当陡峭的学习曲线,当我倾向于制作Word文件或以其他方式操作它们时,我只需制作一个示例文件,解压缩它,然后操作其内部。海事组织的OOXML文件的基础知识很简单,足以使用没有一个大的旧API ...
是所有的MS Word文档序列化为XML可读格式?
简答:没有。
长答案:每发布一次,MS都会更改word文档的格式。因此Word 6.0到95使用格式,Word 97到2002(又名XP)使用另一个,2003另一个,而2007又是另一个。
当然,每个版本都可以以旧格式保存和打开文档(虽然新功能通常无法保存在这些较旧的格式中)。
截至2003年(.doc)的格式是以前版本的增量升级,并且是基于二进制的。
与Office 2007中引入格式文件(.docx)是基于XML的,并被迫为ISO标准“ISO/IEC 29500:2008的Office Open XML”,虽然这个词本身是不是该标准完全兼容。请注意,Word 2007仍然可以以旧的二进制格式保存(并打开)文档。
希望这会有所帮助。
非常感谢,它确实有帮助,虽然它看起来比我希望的更复杂! – ComethTheNerd 2010-04-18 22:35:10
- 1. 是否可以搜索Word文档并返回所有表格?
- 2. MS-MS Word文本格式化宝石
- 3. MS Word ActiveX控件 - 是否可以访问打开的文档?
- 4. 是否可以将XSLT样式表添加到序列化的XML文档中?
- 5. MS Word以XML格式拆分单词
- 6. c#应用程序设置是否可以以XML(protobuf-net)之外的格式进行序列化?
- 7. 以只读模式打开word文档
- 8. 是否可以使用XSLT对XML文档进行颜色编码和格式化?
- 9. XSLT格式化XML文档
- 10. 序列化XML文档
- 11. 使用php读取带有图像的Ms文档word文档
- 12. Word 2010中 - 强制格式化文档
- 13. 是否可以为由POI库创建的word文档定义xml模式?
- 14. XML序列化 - 是否可以用这种方式序列化模型?
- 15. 是否可以将Word文档转换为Google文档?
- 16. 序列化到XML文档
- 17. MS Word - 可以添加嵌入式文档?
- 18. PHP阅读“Unicode”MS Word文档
- 19. 阅读UWP中的MS WORD文档
- 20. 读/写/保存MS Word文档在c#
- 21. 通过Word文档循环以格式化文本
- 22. 以人类可读的文本格式序列化
- 23. 是否可以在.net中执行“混合”XML序列化?
- 24. 是否可以使用XSD的相同格式序列化为XML?
- 25. 如何以编程方式与打开的MS Word文档进行交互
- 26. 阅读形式在MS Word文档中的文字
- 27. 从Word文档的所有空格中删除格式
- 28. 是否可以使用XSL对XML文件进行排序?
- 29. 是否可以在.vbs脚本中进行序列化?
- 30. 是否可以使用序列化属性进行关联?
谢谢你给我一个很好的起点,试验简单的单词文件。我肯定会看到它,现在我有一些想法! – ComethTheNerd 2010-04-18 22:29:53