2017-10-17 82 views
1

我正在尝试使用R型提供程序来拟合和预测支持向量机模型。我能够拟合模型,但是当我尝试预测返回的矢量与训练矢量具有相同的长度时,它不应该有这个长度。为什么R.predict.svm返回错误大小的列表?

我在R中直接尝试了等效代码,并且返回的列表具有正确的长度。

这是怎么发生的?

下面是一个例子:

open System 
open RDotNet 
open RProvider 
open RProvider.stats 
open RProvider.e1071 

// Random number generator 
let rng = Random() 
let rand() = rng.NextDouble() 

// Generate fake X1 and X2 
let X1s = [ for i in 0 .. 9 -> 10. * rand() ] // length = 10 
let X2s = [ for i in 0 .. 9 -> 5. * rand() ] // length = 10 

let Z1s = [ for i in 0 .. 5 -> 10. * rand() ] // length = 6 
let Z2s = [ for i in 0 .. 5 -> 5. * rand() ] // length = 6 

// Build Ys 
let Ys = [0;1;0;1;0;1;0;1;0;1] 

let XMat = 
    ["X1", box X1s; "X2", box X2s] 
    |> namedParams 
    |> R.cbind 

let ZMat = 
    ["Z1", box Z1s; "Z2", box Z2s] 
    |> namedParams 
    |> R.cbind 

let svm_model = 
    ["x", box XMat; "y", box Ys ; "type", box "C"; "gamma", box 1.0] 
    |> namedParams 
    |> R.svm 

let svm_predict = R.predict(svm_model, ZMat) 

let res = 
    if svm_predict.Type = RDotNet.Internals.SymbolicExpressionType.IntegerVector then 
     svm_predict.AsInteger() 
     |> List.ofSeq 
    else failwithf "Expecting a Numeric but got a %A" svm_predict.Type 

printfn "The predicted values are: %A" res 
// The predicted values are: [1; 2; 1; 2; 1; 2; 1; 1; 1; 2] 

这里是最初的R代码:

library(stats) 
library(e1071) 

// Random number generator 
x1 <- 10 * rnorm(10) 
x2 <- 5 * rnorm(10) 
x = cbind(x1, x2) 

z1 <- 10 * rnorm(5) 
z2 <- 5 * rnorm(5) 
z = cbind(z1, z2) 

zs <- c(0,1,0,1,0,1,0,1,0,1) 

svm_fit = svm(x=x,y=zs,type="C",gamma=1.0) 
svm_pred = predict(svm_fit, z) 

print(svm_pred) 
1 2 3 4 5 
1 0 1 1 1 
Levels: 0 1 
+3

你的原始R代码是什么样的? –

+0

我添加了R代码。感谢您的关注。 – Soldalma

+0

我发现'let svm_predict = R.predict(svm_model,ZMat)'中的第二个参数是不相关的。无论我输入什么,结果都是一样的。即使我忽略了这个论点。 – Soldalma

回答

2

我怀疑传递参数给R.predict功能时遇到的问题可能。我不是支持向量机的专家,所以我不知道是什么结果应该给,但是当我把它称为如下,我看到类似的[R版本的结果:

let svm_predict = 
    namedParams ["object", box svm_model; "newdata", box ZMat ] 
    |> R.predict 

我想什么继续是R型提供者推断一些关于predict函数的参数名称的信息,但是不能确切地确定第二个参数是什么 - 所以不是将其作为newdata提供,而是将其作为别的东西提供。

+0

数百万的感谢!我卡住了。我实际上已经尝试过类似的方法,但是我没有在'svm_model'之前放置'box'。我假设,因为'svm_model'是'SymbolicExpression'类型的类型,所以没有必要。第二个想法是,显然所有传递给'namedParams'的元组必须具有相同的类型,即'string * obj'。 – Soldalma

相关问题