2010-07-07 90 views
39

我使用Google搜索(没有任何运气)open source software that can convert doc, ppt, and pdf to HTML5.(究竟是什么Scribd)是否存在与Scribd类型的转换类似的开源代码?将pdf,doc,ppt转换为html5

如果有人知道付费服务,那也可以。 Scribd有一个API,但这是用于Flash查看器。此外,我想主办我自己的内容,因为我需要进一步控制转换后的html文档

+0

你好!这有什么好运? – 2011-01-29 19:48:11

回答

1

http://wvware.sourceforge.net/

wvHtml:转换的Word文档 到HTML4.0。

可能: http://www.abisource.com/ 但在这种情况下,它看起来像“开放文档”>“导出HTML”手动,也许插件的帮助。不知道,你是什么意思:“可以转换的源代码软件”。

或者这样: http://www.zope.org/Members/sf/NuxDocument

另外,pdftohtml会给你的HTML页面output.But你将不得不在它的图形interface.Since工作并不似乎是非常互动。

15

你不可能找到一个能够完成这一切的产品,特别是在开源世界。更可能的是,你最终会依赖于混杂的东西,甚至可能需要链接一些转换器才能获得HTML。 (例如PDF - > ps - > HTML)

OpenOffice支持转换为HTML,并且可以从命令行调用。

http://pdftohtml.sourceforge.net/看起来非常适合将PDF转换为html。

对于Word是Word ML或OpenXML格式的文档,可以想象使用XSLT转换,因为输入和输出格式都是XML。我已经看到了一些样式表在网上漂浮,但是YMMV。

顺便说一下,为什么对开源有特殊要求?例如,MS Powerpoint已支持以HTML格式保存。

+1

适用于OpenOffice的+1 – vladr 2010-09-06 21:20:55

+0

旧版本的powerpoint用于导出一系列内容,如PDF到html的图像。这可能已经改变,因为我还没有尝试过一段时间。 – 2011-03-25 15:42:45

+0

Pdftohtml只是给出一个单一的HTML页面输出,但看起来不是很好。复杂的输出给出了很好的html输出,但它为pdf中的每个页面创建单独的html文档。对于大量的pdf文件可能不可行。 – Daenarys 2013-07-12 04:50:35

5

Open Office将PDF转换为html,但您会打中设计质量。

我建议要么:Crocodoc作为收费服务(它提供了不同的平台,如Python和Ruby,Java的不同口味,PHP开发人员可以在他们的API的工作。)或等待官方的Adobe工具(它在工作中)。

+3

Crocodoc现在免费:) – Viral 2012-04-01 01:06:45

+0

感谢您的更新 – 2012-04-01 19:19:21

-1

我知道这个问题是有点老叫flaxpaper http://flexpaper.devaldi.com/

+0

好吧它现在开源,他们收取服务费。事情多年来一直在改变 – 2017-02-22 16:34:08