在C#应用程序中,我希望将每个HTML“字体”标签与“颜色”属性匹配。匹配嵌套的HTML标签
我有以下文字:
1<font color="red">2<font color="blue">3</font>4</font>56
而且我要包含以下项目一MatchCollection:
[0] <font color="red">234</font>
[1] <font color="blue">3</font>
但是,当我使用此代码:
Regex.Matches(result, "<font color=\"(.*)\">(.*)</font>");
的MatchCollection我得到的是以下内容:
[0] <font color="red">2<font color="blue">3</font>4</font>
如何获得我想用C#的MatchCollection?
谢谢。
你的正则表达式匹配任何东西,一切都变成一个组。你应该知道正则表达式对嵌套的东西不是很好。用HtmlAgilityPack之类的东西解析它会让你更容易(更清洁)。 –
您应该改用HtmlAgilityPack。 http://htmlagilitypack.codeplex.com – Matthew
谢谢!我会尝试! :P – anpep