2017-02-25 64 views
1

我想在下面的格式来提取所有的值,如 “Dance”:BeautifulSoup - 提取<a>值

<a href="http://earmilk.com/category/dance/" 
    class="tiptipBlog genre-dance" 
    title="View all posts in Dance" 
    rel="tag">Dance</a> 

我已经试过:

for a in soup.find_all('a', rel=True): 
    tag = a["rel"] 

这部分工作,打印[u'tag'] 。但这时如果我继续:

print [t.string for t in tag] 

我得到以下错误:

AttributeError: 'unicode' object has no attribute 'string'

我该如何解决这一问题?

回答

1

您应该使用get_text()

soup.find("a").get_text()

会给你u'Dance”

对于链接列表

all_links = soup.find_all("a") 

for link in all_links: 
    print link.get_text()