我正在试验rvest
学习网络抓取R.我试图复制乐高榜样的页面的其他几节,并使用selector gadget
id。网站抓取与R和rvest
我从R Studio tutorial拉下了这个例子。用下面的代码,1和2工作,但3不工作。
library(rvest)
lego_movie <- html("http://www.imdb.com/title/tt1490017/")
# 1 - Get rating
lego_movie %>%
html_node("strong span") %>%
html_text() %>%
as.numeric()
# 2 - Grab actor names
lego_movie %>%
html_nodes("#titleCast .itemprop span") %>%
html_text()
# 3 - Get Meta Score
lego_movie %>%
html_node(".star-box-details a:nth-child(4)") %>%
html_text() %>%
as.numeric()