rvest

    1热度

    1回答

    我不明白为什么我不能在Rvest的某些网站上使用选择器。 实施例: url <- read_html("http://www.cbc.ca/news/politics") headlines <- url %>% html_nodes(".headline") %>% html_text() 又如: library(RSelenium) rD <- rsDriver(verbose

    0热度

    2回答

    这是a prior thread的后续操作。代码对于单个值来说工作得很好,但是当我试图传递超过1个值时出现以下错误,我根据函数的长度得到一个错误。 错误vapply(元件,编码,字符(1)): 值必须是长度为1,但 FUN(X [1])结果是长度为3 下面是代码的样本。在大多数情况下,我只能用这种方式命名对象并进行刮擦。 library(httr) library(rvest) library

    0热度

    1回答

    我正在学习如何使用R进行网页抓取。在这种情况下,我使用包“rvest”和一个名为follow_link的特定函数。 的想法是让拥有多个链接网页的信息。我希望我的代码能够进入这些链接并获取其中的表格。 这是代码: library(rvest) s <- html_session("http://fccee.uvigo.es/es/profesorado.html") link <- c("Der

    0热度

    2回答

    我刮了以下网站:https://www.banorte.com/wps/portal/ixe/Home/indicadores/tipo-de-cambio 我试图让货币汇率表到通过rvest包R的数据框,但表格本身是在HTML代码中的JavaScript变量中配置的。 我所在的相关CSS选择器,现在我有这个: library(rvest) banorte <- "https://www.ba

    0热度

    1回答

    尝试使用网络链接下载多个zip文件。通过这种方法,下载文件,因为得到的文件名覆盖相同的多个年 - library(rvest) url <- "https://download.open.fda.gov/" page <- read_html(url) zips <- grep("\\/drug-event",html_nodes(page,"key"), value=TRUE) zi

    0热度

    1回答

    所以我想抓取一些NBA数据。以下是我迄今为止,它是完美的功能: install.packages('rvest') library(rvest) url = "https://www.basketball-reference.com/boxscores/201710180BOS.html" webpage = read_html(url) table = html_nodes(webpa

    0热度

    1回答

    我试图用rvest从维基百科(包括从其他网页链接)拉ISO国家简介。我找不到包含名称的正确获取链接(href属性)的方法(我试过xpath字符串函数会导致错误)。运行起来相当容易 - 而且自我解释。 任何帮助表示赞赏! library(rvest) library(dplyr) searchPage <- read_html("https://en.wikipedia.org/wiki/IS

    0热度

    1回答

    例如,对于NYC我想从信息框中提取网站(右表)。 我使用这个: url = "https://en.wikipedia.org/wiki/New_York_City" page = read_html(url) links = page %>% html_nodes("table tr a") 但是,这是错误的。

    0热度

    1回答

    我一直在试图解决这一整天,我找不出解决方案。请帮忙 !! 所以学习网页刮,我一直在练习本网站: https://www.net-a-porter.com/fr/fr/Shop/Designers/Fendi 目标是刮每一件产品的价格。 所以,感谢这个网站和其他互联网用户在ressources,我做了这个代码工作完美: option <- remDr$findElement(using = 'xpa

    0热度

    1回答

    有关此数据提取的问题我做了。我想创建一个带有数据的条形图,但不幸的是,我无法将提取的字符转换为R中的数字。如果我在文本编辑器中编辑该文件,根本没有porblem,但是我想要做的全部在R.过程这是代码: install.packages("rvest") library(rvest) url <- "https://en.wikipedia.org/wiki/Corporate