我想解析这个HTML。Scrapy不处理Xpath和CSS选择器中的TBODY
<table id="ctl00_LeftColumnMiddle_Table1" border="0">
<tbody>
<tr>
<td>
<table border="0">
<tbody>
<tr>
<td >Contractor Name</td><td>UNITED RENTALS HIGHWAY TECHNOLOGIES INC</td>
</tr>
</tbody>
</table>
</td>
</tr>
<tr>
<td><table border="0">
<tbody>
<tr>
<td >Contractor Name</td><td>UNITED RENTALS NORTHWEST INC</td>
</tr>
</tbody>
</table>
</td>
</tr>
</tbody>
</table>
它有几个#ctl00_LeftColumnMiddle_Table1
TRS和具有table
每个tr
我要处理的每个记录(事实上是一个TR),然后每个记录的过程细节里面。
我试过这些选择器/ Xpaths。
Selector(response).xpath('//*[@id="ctl00_LeftColumnMiddle_Table1"]/tbody/tr')
和
Selector(response).css('#ctl00_LeftColumnMiddle_Table1 > tbody >tr')
但这不返回任何结果。
但如果我这样做
Selector(response).css('#ctl00_LeftColumnMiddle_Table1 tr')
但这种表达也与Contractor Name
太多选择内tr
秒。
这是Scrapy中的错误吗?
如果是这样,有没有其他方式来处理记录我想要的方式?
'tbody'是自动生成一个标签,所以你最好避免选择 – Andersson