我有一些字大文本超链接,我想知道的所有文字,它的超级链接URL假设我的文字是按如下:查找超链接文本和URL
LoremIpsum.Net是一个小而简单这个静态网站不需要使用generator即可为您提供体面的大小通道。该网站还提供了文本的全部大写版本,以及翻译,以及这个着名的解释。
现在我想存储超链接的单词,它的数组或哈希表中的URL,任何人可以建议我或提供一些示例代码来做到这一点。
在此先感谢。
我有一些字大文本超链接,我想知道的所有文字,它的超级链接URL假设我的文字是按如下:查找超链接文本和URL
LoremIpsum.Net是一个小而简单这个静态网站不需要使用generator即可为您提供体面的大小通道。该网站还提供了文本的全部大写版本,以及翻译,以及这个着名的解释。
现在我想存储超链接的单词,它的数组或哈希表中的URL,任何人可以建议我或提供一些示例代码来做到这一点。
在此先感谢。
见“计划,与正则表达式[C#]刮痧”此页上:http://www.dotnetperls.com/scraping-html
它主要的工作原理是regexing文本并收集比赛。
尝试HTMLAgilityPackhttp://www.codeplex.com/htmlagilitypack
喜欢的东西
HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
{
HtmlAttribute att = link["href"];
// these are your hrefs!
}
你会失去你的心,如果你不使用正确的HTML解析器。
*文中有些词是超链接*?它是如何完成的,我认为文本并没有链接它将控件作为链接的链接(就像你错过了链接[3]它现在不再是链接) – V4Vendetta
你需要解析html的'' - 标签。 – VMAtm
我想查找所有超链接文本,如生成器和它的网址。 – Askiitians