我试图从使用BeautifulSoup的HTML源提取数据。这是源如何处理其colspan ==''的td标签?
<td class="advisor" colspan="">
这里是我的代码:
soup = BeautifulSoup(html, 'html.parser')
tds = soup.find_all('td')
for td in tds:
if td["colspan"] == '':
col = 0
else:
col = int(td["colspan"])
不过,我得到这个错误:
ValueError: invalid literal for int() with base 10: ''
我知道这个错误意味着'不能转化为整数,但为什么我的'如果'不工作?我认为这种情况应该去
col = 0
而不是
col = int(td["colspan"])
你可以做'如果td [“colspan”]。strip()=='':'看看是否有帮助吗? – shahkalpesh
可以包括'A,B,C,D,E,F'吗? – Ian
@shahkalpesh它不起作用。你能告诉我什么是strip()吗?我以前在文档中没有看到它。谢谢:) –