rvest

0热度

1回答

webscraping附加在数据帧的行我有数据帧7行1列，其中包含一个网站链接，我想从这些不同的链接中提取数据，并将其存储在数据框架，但不能附加that.Also我检查，如果为一个链接，如果没有记录（这是我通过该链接的html属性检查）跳过该链接，并继续下一个链接。我也试图为多个页面的链接提取数据。这是重复性的数据 text1="http://www.magicbricks.com/prope

0热度

1回答

我无法在特定页面中使用R硒

当Rselenium遇到此URL时，它会卡住，如果我切换到其他网页，它会好的。您可以看到下面的代码“getCurrentUrl”&“getPageSource”是最基本的操作。 url = "https://sycm.taobao.com/custom/login.htm?_target=http://sycm.taobao.com/" # Build up the environment

1热度

1回答

使用XML和Rvest在R中进行网页搜刮

我试图从NIAC网站上刮掉国会成员的成绩。下面是一个样本代表的链接：https://www.niacaction.org/legislator-bio/?bid=C001097 我的最终目标是建立一个数据框，其中包含国会成员的姓名，州名，分散注意力，然后是第113届 - 115届大会的成绩。我正在使用XML并投入这样做。这里是我的代码： ####----- Load Packages -----#

0热度

2回答

R，网络抓取，Rvest，传输市场数据

我想为个人目的（没有商业用途）抓取transfermarkt数据。特别是，我需要关于给定时间段内所有传输的信息。可以在白天搜索传输，我的计划是使用此页面搜索每一天：https://www.transfermarkt.co.uk/transfers/transfertagedetail/statistik/top/plus/0?land_id_ab=&land_id_zu=&leihe=&datu

1热度

1回答

在rvest中使用submit_form

我试图抓取一个网站的数据。以下是我正在使用的脚本的简化版本。在这个例子中disease.table通过html_table在最后一行retreived应该包括所有的从年2014年2017年。目前，它仅包含2017年 # Initiate wahis.session website session. url <- "http://www.oie.int/wahis_2/public/wahid.p

0热度

1回答

rVest：如何提取值（忽略儿童）

我想从网页中提取值，但对于某些xml结构，我似乎得不到聚合值。 data {xml_nodeset (1)} [1] <span class="match">tusinde<span class="super">1</span></span> 如果我提取文本我得到： data %>% html_text() tusinde1 我要的是： tusinde

0热度

2回答

网站中的R与环从data.frame

library(rvest) df <- data.frame(Links = c("Qmobile_Noir-M6", "Qmobile_Noir-A1", "Qmobile_Noir-E8")) for(i in 1:3) { webpage <- read_html(paste0("https://www.whatmobile.com.pk/", df$Links[i]))

0热度

1回答

麻烦用绳子从开采导致rvest

我从这个网页，其中不提供API或可下载列表挖掘物种的数据： library(rvest) moltres<-1:30 for (i in moltres){ temphtml<-read_html(paste0("http://checklist.aou.org/taxa/",i)) %>% html_node("section") %>%

1热度

1回答

html_attr“href”在搜索结果中返回NA

我的目标是使用rvest来提取与网站中特定CSS元素关联的网址。看过其他几个类似的问题后，我想我需要使用html_attr函数和'href'参数。用我目前的脚本，这只会返回NA值，但我希望它会返回url。输入建立变量 library(rvest) my_url <- "http://www.sherdog.com/events/UFC-Fight-Night-111-Holm-vs-Corr

0热度

2回答

如何使用数据参数链接使用rvest

我试图在Web上刮一个公共数据提供者，但当我点击一个按钮传递一个参数给JS时，我被卡住了。这里是我的尝试： require(rvest) url <- 'https://myterna.terna.it/SunSet/Public/' page <- url %>% read_html() node_link <- page %>% html_node('.sub-item:nth-chil