2013-08-27 79 views
0

首先,我同意这可能听起来像是过去曾多次提出过的问题。然而,在类似的问题中,我找不到与我相关的任何答案,所以我会尽量更具体。django/python:如何使用python将pptx/docx格式转换为PDF?

我需要使用Python将PPTX/DOCX文件转换为PDF但我没有任何文件格式转换的经验。我一直在寻找在许多地方/论坛/网站,阅读了大量的文档和遇到一些有用的库(蟒蛇,PPTXpyPdf为主)来了,但我还是不知道从哪里开始。

在Internet上来看,我可以看到很多网站,提供文件格式转换为付费服务,即使有先进的API:通过POST提交文件并获得转换PDF文件中的回报。这可能对我有用,但我真的很有兴趣写自己的代码,将OOXML转换为PDF。

你会如何开始这样做?还是仅仅靠我自己不可能?

感谢您的帮助!

+1

你可以参考这个问题:http://stackoverflow.com/questions/6011115/doc-to-pdf-using-python – sandeep

+0

我不知道这一点;非常感谢。不过,我正在研究Linux。任何(其他 - 一样好)的想法? – jlibioul

回答

1

经过一番研究,并与蟒蛇,PPTX格式的创造者的帮助下,我能写使用虚拟机的PowerPoint演示COM接口。

如果有人读这个线程,这是我设法完成这个任务: - 安装一个VM上安装了Microsoft Windows/Office; - 在VM上安装Python,Django和win32com库。

文件被局部地从原始Django项目通过简单的POST请求发送到虚拟机(其是在同一网络上)。使用win32com.client(这只是对win32com.client库的简单调用)在VM上转换文件,然后将其作为对原始Django视图的响应发送回来,然后处理响应。

注:我花了一些时间来实现我需要使用此设置工作的@csrf_exempt装饰。

相关问题