2014-02-17 53 views
2

我正在使用DOCX库来操作* .docx文件。可以使用DOCX Library将DOCX文件保存为HTML吗?

我想保存的docx *文件作为一个HTML文件,但是这个代码:

using (DocX sourceDoc = DocX.Create(sourceFilename)) 
{ 
    sourceDoc.SaveAs(sourceHTMLFileName); 
} 

...不起作用(sourceHTMLFileName是 “Bla.html”)。

可能吗?如果是这样,怎么样?

回答

2

DocX的作者在blog post中表示他的库尚不支持此功能。我从codeplex page为图书馆的链接)从链路

报价:

我很想加入这个功能,DOCX,但是有一个问题。

[...]

唯一的简单的方法来做到这一点的转换,是使用微软的Office互操作库

[...]

有没有办法做转换,而不在我的机器上安装了Word.exe。我没有这么说,我说没有简单的方法。 This看起来很有希望,现在如果我只能找到时间。

他建议使用Interop的解决方法,但根据您的环境可能无法实现。

使用SaveAs.html结尾的文件只是保存.docx文件,其扩展名错误;没有转换完成。

+0

“将SaveAs与以.html结尾的文件一起使用只会保存具有错误扩展名的.docx文件;没有转换完成。” 是的,我注意到了。 –

+0

我认为你必须使用你自己的实现从word中读取数据并转换为html。 'MagicText'具有'FormattedText'属性,您可以在其中获取文本的样式信息,但无法获取位置。 更好使用'OpenXml'库并使用'HtmlConverter'类 – xwpdev