2011-10-08 43 views
0

我在C#中遇到了一个问题,那就是
假设有一个网站的链接.... www.xyz.com并假设网站主页上有25个链接。如何使用C#获取网页上的链接?

现在我想的是用C#和asp.net我有一个String数组假设LinkArray [n]和TabArray [N] {字符串数组},我想应该有一个计划, 可以列出所有的链接在数组中,如下所示。

假设链接: <a href="xyz.com/home.html">Home</a> <a href="xyz.com/Contact.html"> </a>

现在我想这两个数组应该被存储为

TabArray[2]= {Home,Contact} 
LinkArray[2]={xyz.com/home.html,xyz.com/contact.html} 

同样我想,我可以列在任何网络的各个环节的细节页。 请建议我一些代码/指南教程 感谢

+0

可能重复(http://stackoverflow.com/questions/100358/looking-for-c-html-parser) –

回答

1

你可以使用sharp-queryHtml Agility Pack解析HTML。下面是用锋利的查询为例:[寻找C#HTML解析器]

using System; 
using XCSS3SE; 

class Program 
{ 
    static void Main() 
    { 
     var sq = new SharpQuery("http://stackoverflow.com"); 
     foreach (var el in sq.Find("a[href]")) 
     { 
      Console.WriteLine("{0} : {1}", el.InnerText, el.Attributes["href"].Value); 
     } 
    } 
} 
+0

有数百个类似的问题与数百个类似的答案。这篇文章应该以愚蠢的方式关闭。 –

+0

我知道它,但没有一个包含有效的答案,其中大部分都是旧的[超过],所以我不得不再次提问。 – ItsLockedOut

相关问题