2014-09-29 62 views
6

我的桌面上有一个文件,它是一个HTML文件。 (在Chrome中,我右键单击网页,选择“另存为”,然后选择“网页,HTML”)。我如何将这个本地文件读入R?一旦进入R,我将需要编写一些正则表达式来解析字符串并提取某些值。将本地HTML文件读入R

非常感谢

+0

退房这个职位有关[用正则表达式解析](http://stackoverflow.com/questions/1732348/regex-match-open-tags -except-XHTML-自足标签)! – 2015-10-16 13:17:16

回答

10

使用readLines如下

rawHTML <- paste(readLines("path/to/file.html"), collapse="\n")