2013-10-02 37 views
1

在向量元素极端值I有一个这样的载体:查找中的R

x<-c(-0.193,-0.126,-0.275,-0.375,-0.307,-0.347,-0.159,-0.268,-0.013,0.070,0.346, 
0.376,0.471,0.512,0.291,0.554,0.185,0.209,0.057,0.058,-0.157,-0.291,-0.509, 
-0.534,-0.239,-0.389,0.060,0.250,0.279,0.116,0.052,0.201,0.407,0.360,0.065, 
-0.167,-0.572,-0.984,-1.044,-1.039,-0.831,-0.584,-0.425,-0.362,-0.154,0.207, 
0.550,0.677,0.687,0.856,0.683,0.375,0.298,0.581,0.546,0.098,-0.081) 

我想每次连续> = 5倍的值是< -0.5到找到最低数目的位置。在该示例中,值为-1.044

我该如何找到它?

我所做的是这样的:

xx<-ifelse(x>.5,1,NA) 
xx 

aa<-rle(xx) 
zz <- rep(FALSE, length(xx)) 
zz[sequence(aa$lengths) == 1] <- aa$lengths >= 5 & aa$values == 1 
zz 

但我只是找到的第一个值的位置,而不是极端。

任何帮助?

+3

类似这样的问题,只是问代码有可能被关闭。请分享您尝试过的以及为什么它不能正常工作。否则,这听起来像你希望我们为你做你的工作! (看看'rle',而你在它) – Justin

+1

我试过使用rle,但我只是能够找到5个连续值开始的位置。不确定我是否可以使用rle。需要一个提示如何找到极值。 – Mart

回答

2

感谢您发布您尝试过的内容。

我只用一个逻辑比较为xx

xx <- x < -0.5 

那么你的RLE逻辑就变成了:

aa <- rle(xx) 
zz <- aa$lengths >= 5 & aa$values 

从那里,识别zz其值为true和使用cumsum获得x(这是过于简化,因为只有一次实例,但你得到的照片)的痕迹:

first <- which(zz) 
idxs <- cumsum(aa$lengths[1:first]) 
min(x[idxs[first-1]:idxs[first]]) 

在你有多个匹配的情况下,first将长度> 1。在这种情况下,一个载体,使一个功能,您可以将其apply到矢量:

myfun <- function(y) { 
    idxs <- c(0, cumsum(aa$lengths[1:y])) 
    min(x[idxs[y]:idxs[y+1]]) 
} 

set.seed(20) 
x <- rnorm(100) 
xx <- x < -0.5 
aa <- rle(xx) 
zz <- aa$lengths >= 3 & aa$values 
first <- which(zz) 

sapply(first, myfun) 
+0

谢谢你回复@Justin,但是你的解决方案给了我价值,而我正在寻找价值的位置。所以我试图在极端值 – Mart

+0

的位置上获得56x FALSE和1x TRUE的输出向量,我敢打赌,这是你可以弄清楚的东西......查看'which.min'。 – Justin

0

与A功能内部应用功能:

find.val <- function(x,threshold,n,all=T){ 
    tmp <- rle(x < threshold) 
    cs <- cumsum(tmp$lengths) 
    dfcs <- data.frame(indices=c(0,cs[-length(cs)])+1,l=cs) 
    pos <- (apply(dfcs,1,function(y) which.min(x[y[1]:y[2]])+y[1]-1))[tmp$values==1 & tmp$lengths >= n] 
    if(all==T) return(pos) 
    pos[which.min(x[pos])] 

}

,如果你设置的所有= T你得到所有匹配,否则只有最低匹配的位置。 例子:

find.val(x,-0.5,5,all=T)