2016-03-22 63 views
0

我有一个2列数据框对应于XY 500个地理参考观测样本的笛卡尔坐标。 我要生成的权重矩阵W¯¯其中每个元素等于:
* :如果观测Ĵk-最近邻观测之一
* :if else
假设我们有此数据帧:R,在矩阵中创建K最近邻居权重

df=as.data.frame(cbind(x=rnorm(500), y=rnorm(500))) 

而让假设K = 20,所以如何创建此矩阵为R?

回答

0

使用CRAN的FastKNN包...比方说,你有5 * 5你的距离矩阵如下:

library(FastKNN) 
df <- as.data.frame(cbind(x = rnorm(5), y=rnorm(5))) 
dist_mat <- as.matrix(dist(df, method = "euclidean", upper = TRUE, diag=TRUE)) 

## Let's say k = 2... 
k <- 2 
nrst <- lapply(1:nrow(dist_mat), function(i) k.nearest.neighbors(i, dist_mat, k = k)) 

## Build w 
w <- matrix(nrow = dim(dist_mat), ncol=dim(dist_mat)) ## all NA right now 
w[is.na(w)] <- 0 ## populate with 0 
for(i in 1:length(nrst)) for(j in nrst[[i]]) w[i,j] = 1 

所以我df是这样的:

> df 
      x   y 
1 -0.2109351 -0.315256132 
2 0.5172415 0.003352551 
3 1.5700413 -0.737475081 
4 -0.2699282 -0.198414683 
5 1.3997493 -0.241382737 

而且我w结束了寻找像这样:

> w 
    [,1] [,2] [,3] [,4] [,5] 
[1,] 0 1 0 1 0 
[2,] 1 0 0 1 0 
[3,] 0 1 0 0 1 
[4,] 1 1 0 0 0 
[5,] 0 1 1 0 0 
+1

我试过鳕鱼e在我的大数据框架上,它的功能非常棒!谢谢 – Houssem