2014-02-19 81 views
1

我分析一个网页后,我可以看到的XPath这样的..R,刮网络与xpathSApply

gethelp.df =htmlTreeParse(url, useInternalNodes = T) 
gethelp.df 
. 
. 
.... 
<div class="lia-message-post-date"> 
     <a class="lia-link-navigation" id="link_14" href="/t5/Facebook/m-p/3947664"> 
      <span class="DateTime"> 
     <span class="local-date">?06-05-2013</span> 
     <span class="local-time">09:38 AM</span> 
</span> 
     </a> 
    </div> 

,我想抓住“2013年6月5日”的一部分。

到目前为止,我尝试了这些和其他一些,但它不起作用。任何人都可以指出我在这里错过了什么?

xpathSApply(gethelp.df, "//span[@class='local-time']", xmlGetAttr, "href") 
xpathSApply(gethelp.df, "//div[@class='lia-message-post-date']/span", xmlGetAttr, "href") 

谢谢!

+0

“06-05-2013”​​是一个值,而不是你试过的属性xmlValue? – jdharrison

+0

谢谢。你是对的!这是一个价值而不是属性! – user1486507

回答

4
xpathSApply(gethelp.df, "//span[@class='local-date']", xmlValue)