我试图从href中提取链接。 <a class="p_l" href="" id="0" target="_blank">
这是在页面查看源中可见的内容,但是当我使用萤火虫检查时,href将包含http://home.website.com/preview/preview?uname=3eadsf132sdas
。我试过使用htmlagilitypack但href返回null。如何提取href中的链接。如何获取href内容
0
A
回答
1
如果你还没有尝试过这种方式比请尝试这种方式
HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();
htmlDoc.OptionFixNestedTags=true;
htmlDoc.Load(filePath);
foreach(HtmlNode link in htmlDoc.DocumentElement.SelectNodes("//a[@href"])
{
if(link != null)
{
if(link["href"] != null)
{
HtmlAttribute att = link["href"];
var url = att.Value;
}
}
1
你可以尝试不同的东西,喜欢把自己使用WebRequest类的HTML内容(见here如何)。
如果href不包含任何链接,这可能意味着它正在使用Javascript或其他编程语言填充以添加动态内容。如果你有权访问脚本,那么你可能有一个很小的机会获得链接,但不这么认为。
相关问题
- 1. 获取href值的内容
- 2. 从html获取href内容和src内容
- 3. 如何获取链接标签的href内容
- 4. 如何从html元素获取href内容
- 5. 如何获取href的值路径,它从HTML内容
- 6. 如何获取iframe内容?
- 7. 如何获取getElementsByTagNameNS内容?
- 8. 如何获取内容?
- 9. framelayout如何获取内容?
- 10. 如何从href获取QueryString?
- 11. 如何获取href值?
- 12. <a href =“/ test /”如何加载内容?
- 13. 如何避免Nokogiri编码href内容?
- 14. 获取内容
- 15. 硒Python如何从href中获取网页内容而不点击它
- 16. 如何从c#中获取我的href标记内容以插入链接?
- 17. 如何在JavaScript中获得“原始”href内容
- 18. 获取href内容并替换JQuery中的()
- 19. 不能获取的href内容NG单击
- 20. 覆盖<a href="">当使用jquery .load获取内容
- 21. Python。从Google搜索结果中仅获取href链接内容
- 22. 如何获取答案的内容?
- 23. 如何从uploadfilefield获取文件内容?
- 24. 如何在python中获取javascript内容
- 25. 如何获取StackPanel的内容高度?
- 26. 如何从JDOM获取节点内容
- 27. 如何获取我的JTextPane的内容?
- 28. 如何使用libxml2获取内容?
- 29. 如何获取已阅读的内容
- 30. 如何获取Activity的内容视图?
这是因为空的'href'的意思是“无论当前的网址是什么”。 Agility Pack无法知道您从何处获取HTML。 – Jon 2012-08-13 10:58:02
是否可以提取链接。如何获得href中的链接。 – Maddy 2012-08-13 11:03:13
@Maddy重申第一位评论者所说的话,没有什么可以提取的。 Firebug向您展示* Web浏览器*所了解的内容。 HTML敏捷包只知道* HTML源*知道什么。浏览器知道它从何处加载HTML,而Html Agility Pack则没有。而不是看着萤火虫,看看“查看来源”。这就是HAP实际所看到的。 – 2012-08-13 11:39:41