2010-09-27 108 views
0

我需要找到一个TR内部的任何内部什么...帮助与正则表达式:标签

<tr class="class1"> 
    more tags here, 
    multiple lines... 
</tr> 

我怎样才能得到任何东西,<tr class="class1"></tr>之间的?

谢谢!

+0

正则表达式不适合解析HTML,因为HTML不是[常规语言](http://en.wikipedia.org/wiki/Regular_language)。请考虑DOM解析器。 – 2010-09-27 04:04:24

+0

可能的重复[什么正则表达式匹配文本不包括HTML标签内的内容?](http://stackoverflow.com/questions/179779/what-regex-will-match-text-excluding-what-lies-within-html -tags) – 2010-09-27 04:09:08

回答

1

You need to use a real HTML parser,正则表达式不足以执行此任务。

这就是说,你可以使用这样一个不好的表达式:/<tr.*?>(.*?)<\/tr>/其中组1将具有(通常)<tr>标签之间的内容,但是不能保证正确性......像嵌套标签这样的东西会抛弃它。 您需要使用真正的HTML解析器

+0

我只需要得到trs之间的内容......如果它的格式正确与否,以及它的内部是什么 – 2010-09-27 04:06:49

+2

如果格式良好或没有格式化,这一点很重要,因为如果您要创建一个正则表达式,你必须考虑到这一点。也可能有无限嵌套的'',并且正则表达式不是递归的。 HTML解析器是要走的路。 – 2010-09-27 04:08:03

+0

谢谢,但没有匹配...我使用.net,应设置任何特殊设置? – 2010-09-27 04:14:56