我想从我订阅的网站提取一些数据。我可以手动提取csv文件,但每天都有一个文件,我需要5年的数据,因此需要很长时间。从网站中提取.csv文件
我已经使用rvest登录网站,但下载我需要手动点击一个按钮的数据,我怎么能在R内做到这一点?
当我手动执行该文件进入我的下载文件夹,这是完全正常的,因为我可以做一个海量导入,但同样如果我可以直接将数据加载到R,会更容易一些。
这是我到目前为止有:
library(rvest)
url <-"http://www.horseracebase.com/index.php/"
pgsession <-html_session(url) ## create session
pgform <-html_form(pgsession)[[1]] ## pull form from session
filled_form <- set_values(pgform,
`login` = "xxx",
`password` = "yyy")
submit_form(pgsession,filled_form)
这让我登录(我认为),但现在我不知道如何提取数据?
我做同样的事情必发在这里我使用类似:
df <- read.csv("http://www.someurl.com/betfairdata.csv")
这工作得很好,但他们所有的文件都实际页,因此无需按键的点击列出。
有没有什么方法可以使用rvest与按钮进行交互,或者有找到正确的URL的方法,所以我可以像上面那样使用read.csv
?
谢谢
@ Floo0我试过没有成功,我无法获得任何示例工作。 – MidnightDataGeek