2017-05-31 15 views
1

我试图从以下页面获得: https://ideas.repec.org/a/aea/aecrev/v92y2002i3p411-433.html 参考列表。Xpath - 尝试获取不在特定div下的所有li对象。

为了让我尝试抓住div“references-body”下的所有“li”元素。

正如您所见,有些情况下列表中包含旧版本或其他版本的引用。我不想那些。

我正在使用下面的代码 - 但它似乎没有工作 任何帮助吗?

//div[@id="references-body"]//li[not(ancestor::div[@class="otherversion" or 
@class="publishedas"]) and (@class="downfree" or @class="downgate" or 
@class="downnone")] 

谢谢!

回答

0

你可以明确地找到需要的元素作为

//div[@id="references-body"]/ol/li 

这将仅返回49主li元素不包括嵌套Other versionsPublished asli元素

+0

我不知道为什么,但这只是给我的第一3排。我在r的rvest软件包中使用了这个xpath,所以它可能与它有关......但我不确定。 –