2016-10-27 147 views
0

我想在R代码在线PCA,这个代码没有现有的实现可用,因此,它可能对其他人有用。可以找到伪代码here(算法1)。我到目前为止已经完成如下:在线PCA在R

PCA<-function(X,k,epsilon){ 
    X_f<-norm(as.matrix(X),"f") 
    d<-nrow(X) 
    n<-ncol(X) 
    l<-floor((8*k)/(epsilon^2)) 
    U<-matrix(0,d,l) 
    C<-matrix(0,d,d) 
    Y<-matrix(0,n,l) 
    for(t in 1:n){ 
     r<-X[,t]-(U%*%t(U)%*%X[,t]) 
     n<-C + r%*%t(r) 
     while(norm(n,"2") >= 2*(X_f^2)/l){ 
      lamb<-eigen(C)$values[1] 
      u<-eigen(C)$vectors[,1] 
      U<-cbind(U,u) 
      #U[,which(!apply(U==0,2,all))] 
      C<-C-(lamb*(u%*%t(u))) 
      r<-X[,t]-(U%*%t(U)%*%X[,t]) 
     } 
     C<-C+(r%*%t(r)) 
     y<-matrix(0,1,l)  
     y<-t(U)%*%x_t 
     Y[t,]<-y 
    } 
    return(Y) 
} 

为了测试我使用了著名的渔民虹膜数据代码:

log.ir <- log(iris[, 1:4]) 
ir.species <- iris[, 5] 

ir.pca <- PCA(log.ir,50,0.2) 

似乎是在代码中的错误,这是不对我来说如此明显,while循环从不停止,有人可以帮忙吗?

+1

这个算法不是一般的,有一个2算法在同一篇论文的附录中更有用 – Jamil

回答

1

这是因为while(norm(n,"2") >= 2*(X_f^2)/l)无法完成,2*(X_f^2)/l)总是小于norm(n,"2")

事实上,如果你打印出来的这些价值观,并debug(PCA)你会看到,他们永远不会改变

function(X,k,epsilon){ 
    X_f<-norm(as.matrix(X),"f") 
    d<-nrow(X) 
    n<-ncol(X) 
    l<-floor((8*k)/(epsilon^2)) 
    U<-matrix(0,d,l) 
    C<-matrix(0,d,d) 
    Y<-matrix(0,n,l) 
    for(t in 1:n){ 
    r<-X[,t]-(U%*%t(U)%*%X[,t]) 
    n<-C + r%*%t(r) 
    while(norm(n,"2") >= 2*(X_f^2)/l){ 
     print(norm(n,"2")) 
     print(2*(X_f^2)/l) 
     lamb<-eigen(C)$values[1] 
     u<-eigen(C)$vectors[,1] 
     U<-cbind(U,u) 
     U[,which(!apply(U==0,2,all))] 
     C<-C-(lamb*(u%*%t(u))) 
     r<-X[,t]-(U%*%t(U)%*%X[,t]) 
    } 
    C<-C+(r%*%t(r)) 
    y<-matrix(0,1,l)  
    y<-t(U)%*%x_t 
    Y[t,]<-y 
    } 
    return(Y) 
} 

debug(PCA) 

一般在要调试的函数中使用print语句是诊断问题的好方法。

+0

给读者的提示:这个答案不会给出正确的算法实现,它只包含额外的'print '陈述。 – knb