所以我需要一些我在R中创建的火车和测试集的帮助。代码的目标是将数据集打破一定数量k
,折叠次数设置将是i
。然后它将返回训练和测试集。我们假设k
将是5
或10
。R训练和测试集
这是我到目前为止。
create_sets<-function(df,k,i)
{
n<-dim(df)[1]
#fold size
size<-n/k
#beggining of test set
test_start<-(size*i)-(size)+1
#end of test set
test_end<-size*i
indices<-df(test_start,test_end)
train<-df[indices,]
test<-df[-indices,]
return (list(train=train,test=test))
}
df
只是x
和y
随机数据帧。那就是:
x<-c(1,6,7,4,3,5,7,8,9,8,7,6,5,4,3,4,5,3,2,1)
y<-c(3,5,6,7,5,4,3,5,7,8,9,0,2,3,4,5,6,7,5,6)
df<-data.frame(x,y)
当我跑我返回一个错误DF
错误代码(test_start,test_end):
说法 “DF2” 缺失,没有默认设置
你的代码是打破因为这行'indices <-df(test_start,test_end)'。你希望从那个电话中得到什么? –
@PierreLafortune我已经想出了解决方案,它其实很简单。索引<-c(test_start,test_end) – Thesystem32
仅供参考包'caret'具有许多功能,您可以立即从这些类型的验证任务中取出。 –