2009-10-12 122 views
0

现在我正在用Perlscript生成HTML,然后在OpenOffice中手动转换为DOC。其实我必须复制,创建新的“文本文档”,粘贴,保存,因为它将HTML和DOC视为单独的文件类型,但这非常不重要。这非常不方便。什么是生成DOC文件的最简单方法?

有任何自动化的方式,我可以HTML转换成DOC得体,或者其它的一些格式,如HTML,我可以以文本方式产生,并转换为DOC以自动化的方式?

(我在OSX)

回答

1

我不能帮助你为.doc,不过你没看到微软的Open XML Format SDK?这将允许您从.NET代码生成Office 2007格式文档(.docx,.xlsx等)。

理论上你可能有一些运气这单下在OS X上,因为它并不需要Office 2007(适用于Windows)的安装工作。

+0

为了兼容性,我需要DOC,而不是DOCX(我个人宁愿只使用HTML,但这是我们生活的世界)。 纠正我,如果我错了,但如果我理解正确,这个SDK并没有真正解决我的问题,只是取代容易生成HTML(或XML)的问题与C#API做相同的难题,米仍然没有接近我曾经以前的DOC。 (除非docx对于正常脚本来说太难以生成,并且SDK做一些非定向的操作)。 – taw 2009-10-12 11:38:34

+0

那么,如果你严格需要.doc,并且没有办法强制你的客户端接受.docx,那么这不是你的解决方案,正如我所说的。 SDK有一个工具,您可以将现有文档提供给它,并且它将生成从scratch_生成该文档所需的C#。 docx世代确实比.doc更容易,但确实还是不平凡的。 – tomfanning 2009-10-12 12:14:12

0

不知道这是你想要的,但你可以很容易地用代码生成WordML文档。 WordML是Word 2003 XML文件格式。这与Office 2007 Open XML格式不同。如果你只是做了基本的格式化,WordML只是一个不难创建的文件。您可以直接生成它,而不是首先创建HTML。您可以使用.DOC扩展名命名这些文件,并且Word 2003及更高版本将会打开它们。如果需要,您可以将它们重新保存为真正的.DOC文件。

这里是在线的WordML参考。如果您愿意,我可以寄给您一些示例代码。 http://msdn.microsoft.com/en-us/library/aa212812(office.11).aspx

如果您确实想要创建可以转换为其他格式的通用文件格式,那么创建XML-FO文件可能是一种可行的方法。有许多产品可以将XML-FO转换为其他文件,如Word和PDF。

0

我们使用了可用于.NET和Java的Aspose的组件。使用Java,你也可以在OS X上使用它们。

您需要购买的组件(即它们不是免费的),但除了这一点,他们真的很棒。

相关问题