0
我可以使用Xpath或CSS。如何仅选择在h4标签后面出现的p标签 - 但不是Nokogiri的儿童?
我想:
my_page.xpath('//h4/p')
,但似乎看起来只是p
标记,是h4
孩子。
的HTML结构我解析如下所示:
<h4 class="ban">Mon May 28</h4>
<p><a href="http://phoenix.craigslist.org/cph/cpg/3043067349.html">.Net/Java Developers</a> - <font size="-1"> (phoenix)</font></p>
<p><a href="http://phoenix.craigslist.org/cph/cpg/3043066699.html">QA and Business Analysts</a> - <font size="-1"> (Phoenix Metro)</font></p>
有页面上的其他p
& a
元素......但基本上是我想要做的就是单词的h4
标签与关联以内在页面上出现的链接(不嵌套在该页面中)。
谢谢。
完美,有效。谢谢!顺便说一下,w3文档xpath的链接是什么? – marcamillion
http://www.w3.org/TR/xpath20/ – Stefan