2011-09-09 48 views
2

我们目前正在将一个Intranet应用程序从ASP移植到ASP.NET。 ASP版本使用了很多框架,我试图在新版本的课程中避免这些框架。在网页中嵌入HTML或Word格式的文本

该应用程序有一个文档模块,我注意到一些文档的内容是用Word格式的文本填充的。 这会干扰应用程序的布局。 ASP版本没有这个问题,因为它使用框架,因此不会干扰其余的布局。

HTML/Word格式的文本被清除与Tidy.NET-library它有一个属性Word2000。不幸的是,这似乎并没有清除所有Word格式的文本。 在网页中插入/显示Word格式文本的可用选项有哪些?或者是框架唯一的出路?

回答

0

您可以尝试使用iframe或使用RegEx删除未被Tidy.NET库删除的标记。这里有一个在.NET中使用正则表达式的教程RegEx tutorial

+0

我认为正则表达式,但它不是我的一杯茶。我已阅读并使用了关于编码恐怖的文章(http://www.codinghorror.com/blog/2006/01/cleaning-words-nasty-html.html),但不幸的是它是由Word保存的HTML而不是常规的Word。也许是时候学习正则表达式了...... – thomasvdb