2016-11-29 50 views
2

尝试使用AWS Lambda上的Python将MS Word文件转换为HTML。对于.docx,我知道有一个名为python-docx的库。但是说到.doc,我仍然无法找到一个优雅而简单的解决方案,因为大多数可能的解决方案都使用LibreOffice或OpenOffice。使用AWS上的Python将MS Word(.doc和.docx)文件转换为HTML Lambda

有没有办法让AWS Lambda上的Python脚本可以操作LibreOffice/OpenOffice的可移植版本?或者,是否有一个我省略的.doc文件的Python库?

+0

您是否找到任何解决方案?如果是这样,请分享您的经验。我也想在Lambda中使用LibreOffice/OpenOffice的一些功能。基本上我想将.doc文件转换为.pdf。 –

回答

1

不幸的是,目前似乎没有优雅的解决方案来解决这个问题。我试图制作LibreOffice/OpenOffice的可移植版本,但最大的问题是尺寸超出了AWS Lambda的限制。

也许你想给Pandoc试试尽管它不能处理.doc文件。但是我成功在AWS Lambda上使用它。您可以访问here了解如何为AWS Lambda制作便携版本。