2016-09-04 58 views
0

根据网址列表像这样的:获取下一个页面的url scrapy

<a href="?resultpage=3&amp;p_department=RL&amp;propertyAddress=&amp;propertyType=&amp;minimumBedrooms=&amp;maximumBedrooms=&amp;minimumPrice=&amp;minimumRentFrequency=pcm&amp;maximumPrice=&amp;maximumRentFrequency=pcm">3</a> 

<a href="?resultpage=2&amp;p_department=RL&amp;propertyAddress=&amp;propertyType=&amp;minimumBedrooms=&amp;maximumBedrooms=&amp;minimumPrice=&amp;minimumRentFrequency=pcm&amp;maximumPrice=&amp;maximumRentFrequency=pcm" title="Next">Next &gt;</a> 

如何我只得到一个具有属性的一个:标题=“下一步”>下一步?

使用:

//@href 

值“标题=”下一步“>下一步”是输,所以它不能被使用的过滤器的URL。

回答

1
response.xpath("//a[@title='Next']/@href").extract_first()