2010-07-05 60 views
8

我正在寻找一个基于python的微软办公分析器 - 特别是powerpoint。微软Powerpoint Python分析器

我想能够解析python中的PPT,并从powerpoint文件中提取文本和图像等内容。

有没有可用的图书馆?

回答

5

我不认为有这样的图书馆。您可以使用pywin32包来访问PowerPoint的COM。

这是一个非常好的介绍如何使用win32com模块自动在PowerPoint有人任务写道: http://www.s-anand.net/blog/automating-powerpoint-with-python/

+0

谢谢!我现在在上面。该链接对了解如何进行整个流程非常有用。 – ramaz 2010-07-05 18:31:23

3

你可能会发现这样的野兽,但我敢打赌;你正在寻找两种罕见的属性。

您可能会考虑改用使用Open Office的SDK,该SDK已有大量机器来读取电源点文件,并将其滥用于您的目的。这是所有的Java,而不是Python,但我的猜测是学习Java的学习曲线比学习曲线要​​小得多,以找出如何阅读PowerPoint文件。