7
我将html作为带有javascript和css代码块的字符串。.Net从html页面中删除javascript和css代码块
事情是这样的:
<script type="text/javascript">
alert('hello world');
</script>
<style type="text/css">
A:link {text-decoration: none}
A:visited {text-decoration: none}
A:active {text-decoration: none}
A:hover {text-decoration: underline; color: red;}
</style>
但我不需要他们。我怎样才能删除与reqular表达式这些块?
你知道吗[托尼小马](http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454)? – GvS 2011-06-17 09:24:15
@GvS:我知道在使用正则表达式处理HTML时可能会出现的问题。因此,对于大多数情况下,我会强烈建议像HtmlAgilityPack这样的html解析器,但这取决于情况。如果是一次性删除脚本和样式块,并且我知道输入是有效的html,那么我的上述正则表达式就足够了,尤其是因为'
只要找一个开放的
<script
标记,然后删除它和关闭/script>
标记之间的所有内容。同样的风格。 See Google为字符串操作提示。
来源
2011-06-17 08:38:06 cusimar9
不一样,如果您的代码文件撰写(“”)在其 – 2011-06-17 10:58:24
是它足以只是这样做的安全感的工作? (阻止JavaScript执行)? – Bamboo 2014-05-23 07:23:54
使用HTMLAgilityPack获得更好的结果
或尝试这个功能
来源
2011-06-17 10:47:22 CodeWrite
我做了我的自行车),他可能不会像HtmlAgilityPack是正确的,但它的速度要快得多了约5-6倍于400 kb的页面。另外,还要小写符号和删除数字(标记生成器制造)
来源
2013-07-03 09:05:06 Suhan