2017-03-22 164 views
-1

我试图刮http://www.casemanagementguidebook.ie/Case-Management-Listings/Accommodation---Homelessness.aspx表,以便我可以输入到MySQL数据库的所有值。当试图做一个壳我已经试过这给了我展示试图刮Scrapy使用Scrapy

table = Selector xpath=u"descendant-or-self::table[@class and contains(concat(' ', normalize-space(@class), ' '), ' listing-table ')]" data=u'<table cellpadding="0" cellspacing="0" b' 

表值的命令

table = response.css('table.listing-table')[0] 

如何访问这些数据呢?我已经使用命令

access = table.css("data").extract() 

尝试和也试图

access = table.css("tbody tr td").extract() 

两者都返回一个空集。我缺少什么路径或命令来访问表中的td?

回答

1

所以你要找的是每个表格行<tr>中的<td>元素。

为了做到这一点,你会

  1. 需要先
  2. 迭代通过每个表行选择所有的表行,并找到了他们每个人的<td>元素。

像这样:

trs = response.css('.listing-table tr') 
for tr in trs: 
    tds = tr.css('td') 
    for td in tds: 
     print td.extract()