我的任务是找到一种方法将大量的.docx文件转换为docbook 5.目前,我们在openoffice中打开该文件并保存到docbook。这是一项耗时的工作,但我相信有更好的方法。这些文件将进一步处理到我们自定义的放松NG模式。因此,这种转换不需要完美无缺。我环顾四周,并会继续调查一些线索,但没有发现任何有用的东西。将word(.docx)转换为docbook
看着Convert doc/docx to semantic HTML他们建议upCast,但这似乎不适合我的需要。
我正在寻找可以从命令行使用的免费功能。我最终想批量处理我们的文件。我已经包含了linux,python和java标签,因为这些是我最舒适的环境,但愿意为正确的解决方案而努力。在我出去重新发明车轮之前,我正在尝试做一些研究。
考虑看openoffice api脚本打开+另存为? – 2011-06-13 15:27:58
我编辑了你的问题,并从中删除了很多,你已经在这里呆了一段时间,但请看看[FAQ],因为不应该添加签名,而你的PS是主观的,几乎是一个不同的问题。请检阅我的修改,看看您的问题是否仍然完整。 – Trufa 2011-06-13 15:28:28
这是Trufa,感谢您的编辑。我想我对电子邮件交换比我更熟悉。 @ThorbjørnRavn Andersen,我没有这可能是一个可行的解决方案。 – matchew 2011-06-13 15:31:23