我使用引入nokogiri得到来自中国的网站(Taobao.com)图片:引入nokogiri:不能屏幕刮页面(taobao.com)
url = "http://item.taobao.com/item.htm?spm=a1z10.1.w137644-1960500098.43.d7Uwpx&id=36246359192"
doc = Nokogiri::HTML(open(url))
puts doc.css("title").text
puts doc.css("img")[0]['src']
puts doc.css("img#J_ImgBooth")[0]['src']
我能拿到冠军和doc.css("img")[0]['src']
,但我无法获得img#J_ImgBooth
。问题是什么?莫名其妙?
'' – cqcn1991
这就是我看到的。有一个'src'属性 – cqcn1991
你是否从chrome的元素检查器中看到了这个?它可能会在页面加载时由js修改,它可能不是Nokogiri正在看到的实际html代码。 – nickcen