有人可以帮我解析一下吗?我有很大的麻烦。我正在解析这个site的信息。Python解析帮助
下面是几行代码从表中提取数据与2个冠军和4个值:
for x in soup.findAll(attrs={'valign':'top'}):
print(x.contents)
make_list = x.contents
print(make_list[1]) #trying to select one of the values on the list.
当我尝试与make_list[1]
行打印出来,它会得到一个错误。但是,如果我拔出最后2行,我会以列表格式获得我想要的html,但我似乎无法分开单个或筛选它们(取出html标记)。任何人都可以帮忙吗?
这里是一个输出示例,我想在这里具体说明。我不知道正确的正则表达式:
['\n', <td align="left">Western Mutual/Residence <a href="http://interactive.web.insurance.ca.gov/companyprofile/companyprofile?event=companyProfile&doFunction=getCompanyProfile&eid=3303"><small>(Info)</small></a></td>, '\n', <td align="left"><div align="right"> 355</div></td>, '\n', <td align="left"><div align="right">250</div></td>, '\n', <td align="left"> </td>, '\n', <td align="left">Western Mutual/Residence <a href="http://interactive.web.insurance.ca.gov/companyprofile/companyprofile?event=companyProfile&doFunction=getCompanyProfile&eid=3303"><small>(Info)</small></a></td>, '\n', <td align="left"><div align="right"> 320</div></td>, '\n', <td align="left"><div align="right">500</div></td>, '\n']
什么是预期输出 – The6thSense
“它得到一个错误”。什么是错误? – Kevin
@Kevin IndexError:列表索引超出范围 –