2012-01-23 80 views
0

我正在构建一个Web应用程序,该应用程序将包含将MS Word(以及可能来自基于Web的富文本编辑器的输入)文档的功能,将值替换为这些文档中的formfield占位符,并生成一个PCL文档作为输出。使用Python从Word文档输出PCL

我在Windows上开发python和django,但是这个整个解决方案需要部署到一个web主机(还有待选择),实际上这意味着解决方案需要在linux上运行。

如果这是唯一的方法,我只接受linux专用解决方案。我对涉及与用其他语言编写的服务器交谈的解决方案持开放态度。如果需要,我可以编写C++或java来完成此任务。最终输出确实必须采用PCL格式。

我的问题是:使用python从Word文档生成PCL的好工具链是什么?

我使用某种接口到OpenOffice打开word文档,做替代,并且输出发送到某种打印机驱动程序的考虑。 有没有人有这方面的经验?你会推荐哪些图书馆?

选项接口,我已经确定包括以下:任何其他建议将会受到极大的欢迎:

第二种方法是使用类似paradocx(https://bitbucket.org/yougov/paradocx/wiki/Home)打开word文件,在python中使用它进行替换,然后以某种方式与可输出PCL的内容进行交互。 再次感谢您对此方法的任何经验或意见。

,我将非常感谢工具和工具链,而且你可能有想法或配方任何评论。

这个问题覆盖相同的理由,但就是不一样:How to Create PCL file from MS word

回答

0

OK,所以我的最终解决方案涉及创建一个Java Web服务来执行我的代码转换。

  • Docx4j提供了一类org.docx4j.convert.out.pdf.viaXSLFO.Conversion它钩入到apache FOP DOCX转换为PDF;可以很容易地砍死转换为PCL(因为FOP输出PCL)
  • Spark是一个轻量级的Java Web框架,这让我总结我的转码器在Web服务
  • 因为我还操纵文档,我需要有一些元数据,所以完美的东西是一个多部分的形式。我解码使用Apache Fileupload

在几乎所有情况下,我不得不升级到库的开发版本,以使其工作。

在Python端使用:

2

的Ghostscript可以读取PS(后记)或PDF和创建PCL。您可以使用Python库或者只是子过程....

+0

谢谢 - 你知道的Python库的接口与ghostscript,或在python中将word转换为pdf的选项?如果你这样做,我会非常感谢你能够链接到他们。 – Marcin

+0

我使用subprocess.Popen()。命令行参数记录在某处... – guettli

+1

https://bitbucket.org/htgoebel/python-ghostscript –