我使用Google搜索(没有任何运气)open source software that can convert doc, ppt, and pdf to HTML5.
(究竟是什么Scribd)是否存在与Scribd类型的转换类似的开源代码?将pdf,doc,ppt转换为html5
如果有人知道付费服务,那也可以。 Scribd有一个API,但这是用于Flash查看器。此外,我想主办我自己的内容,因为我需要进一步控制转换后的html文档。
我使用Google搜索(没有任何运气)open source software that can convert doc, ppt, and pdf to HTML5.
(究竟是什么Scribd)是否存在与Scribd类型的转换类似的开源代码?将pdf,doc,ppt转换为html5
如果有人知道付费服务,那也可以。 Scribd有一个API,但这是用于Flash查看器。此外,我想主办我自己的内容,因为我需要进一步控制转换后的html文档。
http://wvware.sourceforge.net/
wvHtml:转换的Word文档 到HTML4.0。
可能: http://www.abisource.com/ 但在这种情况下,它看起来像“开放文档”>“导出HTML”手动,也许插件的帮助。不知道,你是什么意思:“可以转换的源代码软件”。
或者这样: http://www.zope.org/Members/sf/NuxDocument
另外,pdftohtml会给你的HTML页面output.But你将不得不在它的图形interface.Since工作并不似乎是非常互动。
你不可能找到一个能够完成这一切的产品,特别是在开源世界。更可能的是,你最终会依赖于混杂的东西,甚至可能需要链接一些转换器才能获得HTML。 (例如PDF - > ps - > HTML)
OpenOffice支持转换为HTML,并且可以从命令行调用。
http://pdftohtml.sourceforge.net/看起来非常适合将PDF转换为html。
对于Word是Word ML或OpenXML格式的文档,可以想象使用XSLT转换,因为输入和输出格式都是XML。我已经看到了一些样式表在网上漂浮,但是YMMV。
顺便说一下,为什么对开源有特殊要求?例如,MS Powerpoint已支持以HTML格式保存。
对PDF有由Mozilla启动了一个开源项目,这是非常好的:https://github.com/mozilla/pdf.js/
你可以看到一个Hello World例子:https://github.com/mozilla/pdf.js/tree/master/examples/helloworld
对于文档类型的其余部分,我认为LibreOffice的说,是计划在html5中构建一些东西,但到目前为止,还没有做任何事情。
我知道这个问题是有点老叫flaxpaper http://flexpaper.devaldi.com/
好吧它现在开源,他们收取服务费。事情多年来一直在改变 – 2017-02-22 16:34:08
对于PDF到HTML的转换,但是我已经找到了新的开源工具,pdf2htmlEX似乎是一个非常好的工具(看着所有的例子/样本):
你好!这有什么好运? – 2011-01-29 19:48:11