我尝试使用HtmlAgilityPack
库解析这些html内容时遇到了很大的麻烦。HtmlAgilityPack Html节点问题
在这一段代码,我想只检索URL(HREF),其reffers到uploaded.net,但我不能确定是否在URL reffers它。
<div class='downloads' id='download_block'>
<h5 style='text-align:center'>FREE DOWNLOAD LINKS</h5>
<h4>uploadable.ch</h4>
<ul class='parts'>
<li>
<a href="http://url/..." target="_blank"> text here</a>
</li>
</ul>
<h4>uploaded.net</h4>
<ul class='parts'>
<li>
<a href="http://url/..." target="_blank"> text here</a>
</li>
</ul>
<h4>novafile.com</h4>
<ul class='parts'>
<li>
<a href="http://url/..." target="_blank"> text here</a>
</li>
</ul>
</div>
这是怎么看的网页上
这就是我:
nodes = myHrmlDoc.DocumentNode.SelectNodes(".//div[@class='downloads']/ul[@class='parts']")
我不能只用一个数组索引来确定像这样的位置:
nodes(0) = uploadable.ch node
nodes(1) = uploaded.net node
nodes(2) = novafile.com node
...因为它们可以改变节点的数量和其托管位置。
注意,同样的URL不会包含主机名,就像重定向:
http://xxxxxx/r/YEHUgL44xONfQAnCNUVw_aYfY5JYAy0DT-i--
我能做的,在C#或者VB.Net?
谢谢,是最简单和真棒的答案,那是什么样的黑魔法?那些句子真的是XPATH语法的一部分?只有一个问题:“包含”是不区分大小写的?如果是的话,那就完美了。 – ElektroStudios
@ElektroStudios是的,它是区分大小写的,你想让它不区分大小写吗?你可以但它会变得难看 –
我应该使它不区分大小写,以防止未来的麻烦,如果你能帮助我 – ElektroStudios