我一直在试图解决这些问题的最后两个小时,但似乎我找不到任何解决方案。提取链接正则表达式c#
我需要从HTML
文件中提取链接。有100多个链接,但只有25个是有效的。
的有效链接都放在里面
<td><a href=" (link) ">
首先,我有(现在仍然有)与逐字字符串中双引号的问题。所以,我用“正常”的字符串替换逐字这样我就可以使用\“为”,但问题是,这Regex
我写不工作
Match LinksTemp = Regex.Match(
htmlCode,
"<td><a href=\"(.*)\">",
RegexOptions.IgnoreCase);
我得到"<td><a href="http://www.google.com">
输出,而不是http://www.google.com
任何人都知道如何解决这个问题,我该如何使用双引号逐字字符串内(例如@“<>‘DAS’SA”)
是的,THX但为什么犯规,如果我写的群体它的工作[0] – Triple 2011-06-10 23:47:00
因为组[0]记住所有的字符串是匹配的。组[1]在()之间剪切文本。如果你的正则表达式是:“”那么在组中[1]将是“href”并且在组中[2]将是你的www adres – nirmus 2011-06-10 23:56:02
+1为gppd解释。 – corlettk 2011-06-11 00:13:43