我有兵HTML,我想从它与解析结果:解析HTML与正则表达式
string BingRegex = "<div class=\"sb_tlst\"><h3><a href=\"(.*?)\"";
string[] results = Regex.Matches(responseStr, BingRegex).Cast<Match>().Select(m => m.Value).ToArray();
我得到的结果为数组,但它的模式添加到每个结果,是这样的:
<div class=\"sb_tlst\"><h3><a href=\"www.cnn.com\"
<div class=\"sb_tlst\"><h3><a href=\"www.google.com\"
<div class=\"sb_tlst\"><h3><a href=\"www.gmail.com\"
任何想法如何解决这个并获得唯一的网址是什么?
你不应该使用正则表达式来解析html。 – gleng
见http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags –
好就可以了,但它会很快出问题你。 –