我试图从一个原始数值空间deliminated文本文件做一个RDATA文件,即原始数据转换文件RDATA文件
11 33 55
22 33 45
25 78 00
44 87 99 ....
我有另一条R脚本,需要加载这个新的RDATA文件并执行使用mapreduce(rhipe)与数据进行线性回归。因此,当我保存这个RObject我需要读回这样:
data <- strsplit(unlist(map.values)," ")
#so that I can run regression like:
y<- unlist(lapply(data,"[[",1))
x1<-unlist(lapply(data,"[[",2))
x2<-unlist(lapply(data,"[[",3))
lm(y~x1+x2)
我已经尝试了许多方法来我的数据保存到RDATA对象,包括表格,列表和as.character,但非成功所以我可以使用我的上述方法来阅读它。我怎样才能保存我的原始文件,以便我可以用上面的方式阅读它?谢谢。
(PS。因为我是从映射器内部的HDFS文件中读取数据,我不能使用负载/功能函数read.table)
https://github.com/RevolutionAnalytics/RHadoop/wiki/rhdfs有什么用? – mnel 2013-02-27 03:34:07