可能重复:
Reading/Writing MS Word files in Python是否有用于编辑msword doc文件的python库?
我知道有一些库编辑Excel文件,但有什么用Python进行编辑MSWORD 97/2000/2003 .doc文件?理想情况下,我希望根据文本的内容对文本的格式进行一些小的更改。一个非常微不足道的例子就是强调从首都开始的每一个字。
可能重复:
Reading/Writing MS Word files in Python是否有用于编辑msword doc文件的python库?
我知道有一些库编辑Excel文件,但有什么用Python进行编辑MSWORD 97/2000/2003 .doc文件?理想情况下,我希望根据文本的内容对文本的格式进行一些小的更改。一个非常微不足道的例子就是强调从首都开始的每一个字。
为什么不使用python-uno将文档加载到OpenOffice并使用UNO界面进行操作。我刚刚链接的网站上有一些示例代码,可以帮助您开始。
PyWin32库允许您从Python访问COM对象,包括所有各种Office COM API。我不会声称这是容易使用,但它确实有效。
如果平台独立性很重要,那么我建议通过BASIC或Python使用OpenOffice API。 OpenOffice也可以在没有GUI的无头模式下运行,因此您可以将其自动化用于批量作业。这些链接可能会有所帮助:
这绝对不是导入模块,做一个字符串替换更多地参与,但OpenOffice的可能是最好的免费的.doc读者,你可以钩入。
每this SO post,我发现约jXLS,它使用Apache POI。 POI有许多子组件,包括HWPF:
HWPF是我们将Microsoft Word 97文件格式转换为纯Java的端口。它支持读取和限制写入 的功能。请参阅HWPF 项目页面以获取更多信息。 这个组件在开发的早期阶段 。它已经可以读取 并编写简单的文件。
由于这是一个Java库,因此可以使用Jython编写脚本。我不知道写作能力有多好,但如果有帮助,请发表评论。
任何想法如何在Linux中做到这一点? – Shule 2014-09-06 04:28:40
较新的办公文件可能可以用单声道处理,但我从来没有尝试过。 – 2014-09-06 04:30:30