2011-03-29 170 views
0

嘿, 我有一个包含例如以下标记HTML页面:xpath查询的表达式?

<p foruri="http://doc.scrapy.org/getting-help:solving-specific-problems" rec="lang.en" id="solving-specific-problems">Hello world!!! From my authoring tool.</p> 

<p foruri="http://doc.scrapy.org/getting-help:getting help" rec="lang.en" id="getting help">Hello world!!! From my authoring tool.</p> 

现在我写使用python中scrapy框架履带,在我使用的cxxpath查询找到foruri标签作为//@foruri这应该给我的foruri标记,但它存在的问题是,但它不会产生http:

所以帮助我得到它?

回答

0

假设你想提取foruri属性的所有<p>标签:

hxs.select('//p/@foruri').extract()