我工作的一个项目,我有很多的分析家创造R.统计模型的他们通常提供给我的模型对象(.Rdata文件)和我自动执行它们的各种数据集。序列化.RData文件数据库
我的问题是:
我可以使用一个数据库,并有保存这些文件.RData?任何暗示这样做? (我目前将.Rdata文件存储到磁盘并使用数据库存储位置信息)
我从其他分析师那里得到很多R脚本,他们在创建模型之前对数据进行了一些预处理。有没有人有使用PMML的经验,使这个过程可重复无需人工干预? PMML将预处理步骤,建模步骤存储为标记标记,并将在新数据集上重复相同步骤。
感谢您的建议和反馈。
-Harsh
即使斑点不支持,你可以序列化/反序列化,并从ASCII(因为你甚至在你的例子一样),然后保存ASCII字符串。 – 2010-10-17 23:23:14
我以为我这么说?我说错了吗? – 2010-10-17 23:25:23
注意,ASCII序列obj为16K字节大(长(OBJ)),二进制版本是11K字节大,但如果保存(“TT”,文件=“tt.RData”),你得到的东西只有5K大。 – Spacedman 2010-10-18 07:41:17