我想从Indeed.com的工作板上的公司名单和工作表。R - Web Scrape的工作板
我使用使用http://www.indeed.com/jobs?q=proprietary+trader&
install.packages("gtools")
install.packages('rvest")
library(rvest)
library(gtools)
mydata = read.csv("setup.csv", header=TRUE)
url_base <- "http://www.indeed.com/jobs?q=proprietary+trader&"
names <- mydata$Page
results<-data.frame()
for (name in names){
url <-paste0(url_base,name)
title.results <- url %>%
html() %>%
html_nodes(".jobtitle") %>%
html_text()
company.results <- url %>%
html() %>%
html_nodes(".company") %>%
html_text()
results <- smartbind(company.results, title.results)
results3<-data.frame(company=company.results, title=title.results)
}
new <- results(Company=company, Title=title)
一个URL基地rvest包,然后循环一个contatenation。出于某种原因,它并没有抓住所有的工作,混合公司和工作。
我认为例子将有助于研究这个问题。所以请添加一个工作和一个非工作示例 – Marged
您可以请发布一个代码工作的名称样本? – Metrics