rvest

    0热度

    1回答

    我是新来的rvest。如何在标签中提取具有2个类名称或只有1个类名的元素? 这是我的代码和问题: doc <- paste("<html>", "<body>", "<span class='a1 b1'> text1 </span>", "<span class='b1'> text2 </span>", "</body>",

    0热度

    1回答

    问题:使用rvest我似乎无法找到我需要从我通过幽灵js呈现的html页面的信息块。我已经尝试了几乎所有可能的格式,但我似乎无法让html_node选择正确的块。 HTML代码幻影呈现: <div class="page"> <div class="main-header"> </script> <div id="listing-703036966" class="shop-s

    2热度

    1回答

    我正在寻找从化学数据库中使用R,主要是name,CAS Number和molecular weight现在刮一些数据。但是,我无法获取rvest来提取我正在查找的信息。这是我到目前为止的代码: library(rvest) library(magrittr) # Read HTML code from website # I am using this format because I u

    1热度

    1回答

    我正在做一个网页抓取项目this website。 在这一刻,我想要做的就是从这样的一个URL刮艺术家名称:https://lsdb.eu/artists/view/225/ 由于没有设置为编号225的艺术家,存在的页面。但是,https://lsdb.eu/artists/view/226/不存在,但是存在数量高于226的页面。 有什么办法可以刮掉网站,看看哪个https://lsdb.eu/a

    0热度

    1回答

    加载更多按钮刮网站我试图用加载更多按钮刮网站。我已经通过使用Windows提示设置了一个硒服务器。 Selenium服务器正在运行,但是当我在R中运行脚本时,我仍然收到以下错误。我已经写了很多博客文章并试图找到答案,但我缺乏技术知识来解决这个问题,所以我希望有人愿意帮助我。 错误 [1] "Connecting to remote server" Selenium message:The path

    0热度

    1回答

    我正在尝试使用rvest从表格中提取数据。以下是我正在使用的代码 mcurl<-read_html("http://www.moneycontrol.com/financials/tataconsultancyservices/balance-sheetVI/TCS#TCS") 使用以下代码我只能够获取标题而不是整个表的内容。 html_table(html_nodes(mcurl, "tab

    0热度

    1回答

    使用HTML会话链接我试图浏览到一个网站上的链接。除了一个链接,所有链接都可以工作。结果如下。 > mcsession<-html_session("http://www.moneycontrol.com/financials/tataconsultancyservices/balance-sheetVI/TCS#TCS") > mcsession<-mcsession %>% follow_

    0热度

    1回答

    我已经创建了下面的代码 library('XML') library('rvest') links <- c('https://www.google.com/', 'https://www.youtube.com/?gl=US', 'https://news.google.com/news/u/0/headlines?hl=en&ned=us') for (i

    0热度

    1回答

    我试图建立一个数据框与我在IMDB上刮过的2个数据:第一个有50个值,第二个只有29个。是否有一个简单的方法来要求R自动填充NA其他21他没有找到的价值? 我的代码: imdb <- read_html("http://www.imdb.com/search/title?genres=horror&genres=mystery&sort=moviemeter,asc&view=advanced")

    0热度

    1回答

    我正在刮一张桌子。 dput(head(temp_data)) structure(list(link = c("http://ujp.gov.mk/mk/prebaruvanje_pravni_lica/prikazi?edb=MK4030998342636", "http://ujp.gov.mk/mk/prebaruvanje_pravni_lica/prikazi?edb=MK4030