2015-11-16 69 views
0

您好,我正在尝试从HTML页面检索第3个HREF标记。但是下面的代码不会返回任何结果。任何提示/答案是真的我试图解析useful.The网址如下:无法从标记中检索HREF

http://pr4e.dr-chuck.com/tsugi/mod/python-data/data/known_by_Fikret.html

代码是这样的:

# This python code will parse an html and 
    # find href content from a particular position 

    import urllib 
    from BeautifulSoup import * 

    url = raw_input('Enter - ') 
    html = urllib.urlopen(url).read() 
    soup = BeautifulSoup(html) 

    # Retrieve all of the anchor tags 
    tags = soup('a',limit=3)[2] 
    for tag in tags: 
     print tag.get('href', None) 
+0

我是初学者,通过Coursera学习Python。这是一个任务,所以我宁愿提示或任何线索,我要去哪里错了,而不是直接的答案:)谢谢! –

+0

发布'tags'变量的输出.. –

+0

最好在Coursera论坛上询问以帮助您。 – Valijon

回答

0

使用

tags = soup('a', limit=3)[2] 

print tags.get('href', None) 

或删除[2]

tags = soup('a', limit=3) 

for tag in tags: 
    print tag.get('href', None) 
+0

谢谢@furas,这很容易理解,并最终解决了我的问题!万分感谢! –

+0

@SwatiMishra然后接受这个答案! – SIslam

+0

@SIslam刚刚做到了!谢谢你告诉我。我是新来的stackoverflow! –