2017-07-27 27 views
0

我使用rvest来抓取网络数据。 我从一个网站下面的CSS代码:从rvest的Scrape标题属性

<abbr class="intabbr" title="2.856.890">2,9M</abbr> 

我凑与

library(rvest) 
library(dplyr) 
n <- read_html("https://www.last.fm/de/music/Fang+Island") 
n %>% 
html_node("abbr") %>% 
html_text() 

这个数据这给了我“2M”,但我想获得的是“2.856.890 ”。

我不是很了解CSS:是否可以通过更改html_node()中的表达式来获取我想要的信息?

This post暗示这是不可能的,但this one暗示它可能是可能的,因为它弹出作为页面上的工具提示?

回答

1

使用html_attr获得标签的属性:

n %>% 
    html_node("abbr") %>% 
    html_attr("title")