-1
我是新来的网络抓取并希望将其用于感性分析。我已经成功取消了前10条评论。对于其他280条评论,我犹豫要重复以下过程超过20次......我想知道是否有一个包/功能可以让我以更简单的方式抓取所有评论?非常感谢!如何使用rvest从IMDB中删除所有电影评论
library(rvest)
library(XML)
library(plyr)
HouseofCards_IMDb <- read_html("http://www.imdb.com/title/tt1856010/reviews?ref_=tt_urv")
#Used SelectorGadget as the CSS Selector
reviews <- HouseofCards_IMDb %>% html_nodes("#pagecontent") %>%
html_nodes("div+p") %>%
html_text()
#perfrom data cleaning on user reviews
reviews <- gsub("\r?\n|\r", " ", reviews)
reviews <- tolower(gsub("[^[:alnum:] ]", " ", reviews))
sapply(reviews, function(x){})
print(reviews)