2011-05-27 37 views
-1

嗨 正在开发一种小型搜索引擎类应用程序。它在Word文档中搜索内容。我需要在gmail中实现一个“view as html”选项。当我点击链接到文档时,它应该在新浏览器中作为html页面打开。有什么办法可以做到这一点?在浏览器中以HTML格式查看MS Word

我能够在iframe中打开word doc,但这不符合我的目的。

我的应用程序使用Asp.Net和C#。任何帮助,将不胜感激。

问候

维涅什

+1

看着Google Docs? – 2011-05-27 16:21:53

+0

看到这个,它可能会帮助你:http://stackoverflow.com/questions/3694090/saving-multiple-word-documents-as-html-through-office-api – contactmatt 2011-05-27 18:57:15

+0

@Tony:这可能是我的部署网络可能无法访问互联网。我不确定我是否可以在没有互联网的情况下使用Google文档。 – vikky114 2011-05-28 06:45:04

回答

0

使用方便,速度慢,内存密集型,不可扩展的,不可扩展(需两次说)做这件事是使用Office COM API来加载文件的方式将它保存为html(或者其他文本,因为所有你想要做的都是搜索),但是我真的怀疑你可以在一个适度使用的网站上关闭它。

抛开这一点,您只剩下开源解析器或使用IFilter接口来完成它。我找到了后者的一个例子:http://www.neowin.net/forum/topic/316480-reading-text-from-ms-word-files-in-c

+0

我在搜索文档中的文本时没有问题。我使用Solr及其提取处理程序从word文档中提取文本。现在我需要一种方式来显示单词文档给搜索者,当他点击链接时。我认为把它显示为html会很好...... – vikky114 2011-05-27 16:40:39

+0

噢......好吧......在这种情况下,我没有任何建议。这根本不是微不足道的。 – Blindy 2011-05-27 16:44:51