0
我有一个2列数据框对应于X和Y 500个地理参考观测样本的笛卡尔坐标。 我要生成的权重矩阵W¯¯其中每个元素等于:
* :如果观测Ĵ是k-最近邻观测我之一和
* :if else。
假设我们有此数据帧:R,在矩阵中创建K最近邻居权重
df=as.data.frame(cbind(x=rnorm(500), y=rnorm(500)))
而让假设K = 20,所以如何创建此矩阵为R?
我有一个2列数据框对应于X和Y 500个地理参考观测样本的笛卡尔坐标。 我要生成的权重矩阵W¯¯其中每个元素等于:
* :如果观测Ĵ是k-最近邻观测我之一和
* :if else。
假设我们有此数据帧:R,在矩阵中创建K最近邻居权重
df=as.data.frame(cbind(x=rnorm(500), y=rnorm(500)))
而让假设K = 20,所以如何创建此矩阵为R?
使用CRAN的FastKNN
包...比方说,你有5 * 5
你的距离矩阵如下:
library(FastKNN)
df <- as.data.frame(cbind(x = rnorm(5), y=rnorm(5)))
dist_mat <- as.matrix(dist(df, method = "euclidean", upper = TRUE, diag=TRUE))
## Let's say k = 2...
k <- 2
nrst <- lapply(1:nrow(dist_mat), function(i) k.nearest.neighbors(i, dist_mat, k = k))
## Build w
w <- matrix(nrow = dim(dist_mat), ncol=dim(dist_mat)) ## all NA right now
w[is.na(w)] <- 0 ## populate with 0
for(i in 1:length(nrst)) for(j in nrst[[i]]) w[i,j] = 1
所以我df
是这样的:
> df
x y
1 -0.2109351 -0.315256132
2 0.5172415 0.003352551
3 1.5700413 -0.737475081
4 -0.2699282 -0.198414683
5 1.3997493 -0.241382737
而且我w
结束了寻找像这样:
> w
[,1] [,2] [,3] [,4] [,5]
[1,] 0 1 0 1 0
[2,] 1 0 0 1 0
[3,] 0 1 0 0 1
[4,] 1 1 0 0 0
[5,] 0 1 1 0 0
我试过鳕鱼e在我的大数据框架上,它的功能非常棒!谢谢 – Houssem