我试图用Nokogiri刮html。 这是html源代码:用Nokogiri刮:: HTML - 无法从XPATH获取文本
<span id="J_WlAreaInfo" class="wl-areacon">
<span id="J-From">山东济南</span>
至
<span id="J-To">
<span id="J_WlAddressInfo" class="wl-addressinfo" title="全国">
全国
<s></s>
</span>
</span>
</span>
我需要得到下面的文字:山东济南
经过与萤火虫最短XPATH:
//*[@id="J-From"]
这里是我的Ruby代码:
doc = Nokogiri::HTML(open("http://foo.html"), "UTF-8")
area = doc.xpath('//*[@id="J-From"]')
puts area.text
但是,它什么也没有返回。 我在做什么错?
也许你可以给我们一个链接的网页?另外,你可以看看最初的页面源代码:可能是在页面加载后在JavaScript中创建'',但Nokogiri没有看到这样的东西? – LarsH
你可能想看看在这里关于打开uri的顶级投票答案http://stackoverflow.com/questions/2572396/nokogiri-open-uri-and-unicode-characters – jvnill
谢谢你们一千次,它是一个JS问题。 – Zoru