2013-02-20 66 views
0

我学习的XPath &网络使用Django动态刮除又名DSS(Django的+ scrapy)刮并尝试从一个网站,下面的代码检索数据:刮无链接

<tr valign="top"> 
    <td align="center" valign="top"> 
     <p><img src="someimage.jpg"></p> 
    </td> 
    <td> 
    &nbsp; 
    </td> 
    <td> 
     <div align="left"> 
      <span class="style1"> 
       <strong>Title1</strong> 
      </span> 
      <span class="style2">Title2:</span>ContentA<br /> 
      <span class="style2">Title3:</span>ContentB<br /> 
      <span class="style2">Title4:</span>ContentC<br /> 
     </div> 
    </td> 
</tr> 

我的问题:

  • 如果在该代码中没有链接,an URL object of DSS的xpath是什么?
  • 如果首先没有课程<td>,那么检索图像文件的xpath是什么?
  • 如何检索的每个数据来自ContentA,ContentB,&的数据如果跨度的类是same

回答

1

如果在该代码中没有链接,DSS的URL对象的xpath是什么?

不能得到的问题,请你解释一下吗?

如果没有第一个类,检索图像文件的xpath是什么?

//tr[1]/td[1]//img/@src

如何检索从ContentA,ContentB每个数据数据,& ContentC 如果跨度的类是一样的吗?

//text()[preceding-sibling::span[@class="style2"]]