我试图让选择列表中this page:什么是正确的xpath来刮这个网页?
$("#Lastname"),$(".intro"),....
这里使用xpathSApply
我尝试:
library(XML)
library(RCurl)
a <- getURL('http://www.w3schools.com/jquery/trysel.asp')
doc <- htmlParse(a)
xpathSApply(doc,'//*[@id="selectorOptions"]') ## I can't get the right xpath
我也试过,但没有成功:
xpathSApply(doc,'//*[@id="selectorOptions"]/div[i]')
编辑我添加python标签,因为我也接受python解决方案。
JavaScript正在运行在此页上c reate你正在寻找的内容。例如'var w3SelDescriptions = []; w3SelDescriptions.push('id =“Lastname”'的元素');' 您需要从浏览器或类似的东西获取javascript页面。 – jdharrison
@jdharrison恐怕我不明白你的观点。你的意思是选择器是由这个调用创建的:'onload =“w3jQuerySelectorLoad()'? – agstudy
选择器列表是由一段javascript代码创建的 – jdharrison