2016-07-18 19 views
0

我在BeautifulSoup 4. td标签有可能是里面的a标签:如果存在标签,则获取标签的属性;否则无

row.find_all('td')[2].find('a') 

如果有,我想检索a标签的href属性。否则,我想None

这是我想过的:

getattr(row.find_all('td')[2].find('a'), 'attrs', {}).get('href') 

什么是做到这一点的有效途径?

实例行:

<tr><td><a href="http://google.com">405</a></td> 
\n<td><font face="Arial" size="-1">12-Jul</font></td>\n<td><font face="Arial" size="-1">There could be an a-tag here.</fo 
nt></td>\n<td><font face="Arial" size="-1">On Motion</font></td>\n<td align="CENTER"><fo 
nt face="Arial" size="-1">F</font></td>\n<td><font face="Arial" size="-1">\xa0</font></td></tr> 
+0

什么是你解析的HTML,至少是“行”和下面。 – TankorSmash

+0

@TankorSmash补充说 – Hatshepsut

回答

1

您可以选择第二个tr和任何锚点,然后检查使用if:

a = soup.select_one("tr:nth-of-type(2) a[href]") 


if a: 
    print(a["href"]) 

如果没有锚将是无,如果有你可以提取href。