所以我想网络刮https://en.wikipedia.org/wiki/FIFA_World_Rankings和刮在页面上的第一个表,但它没有奏效,我得到一个错误'NoneType'对象可调用。在Python中的网页刮
这里是我的代码:
from bs4 import BeautifulSoup
import urllib2
soup = BeautifulSoup(urllib2.urlopen("https://en.wikipedia.org/wiki/FIFA_World_Rankings").read())
for row in soup('table', {'class': 'wikitable'})[0].tbody('tr'):
tds = row('td')
print tds[0].string, tds[1].string
我不知道很多关于HTML,我所知甚少网页抓取。
'row('td')'...'row'不是一种方法,所以它不是“可调用的”。 'tbody('tr')'也许相同 –
另外 - 我建议你使用请求库,而不是'urllib2'库 - 'request'是一种更好的获取网页的方式。 –