我相信我们已经解决了我们自己的问题。原始问题涉及的是来源和目的地,而不是数值。所以,我发布了这个答案 - 这是一个轻松切换到数字。希望这有助于未来的人。
library(dplyr)
library(sqldf)
x<-data.frame(orig=as.character(sample(LETTERS[1:10], 100, replace=TRUE)), dest=as.character(sample(LETTERS[1:10], 100, replace=TRUE)))
x$orig<-as.character(x$orig)
x$dest<-as.character(x$dest)
x1<-sort(unique(c(x[,1], x[,2])))
x_ind<-data.frame(loc=x1, ind=1:length(x1))
xx<-sqldf("select a.*, b.ind as orig_ind from x as a left join x_ind as b on a.orig=b.loc")
xxx<-sqldf("select a.*, b.ind as dest_ind from xx as a left join x_ind as b on a.dest=b.loc")
comb<-function(orig, dest, orig_ind, dest_ind)
{
if (orig_ind<=dest_ind)
{
out<-paste(orig, dest, sep="-")
} else
{
out<-paste(dest, orig, sep="-")
}
return(out)
}
orig_dest<-apply(xxx, 1, function(x) comb(x[1], x[2], x[3], x[4]))
xxxx<-data.frame(xxx, orig_dest)
谢谢Henrik的编辑。 – Jcrist 2015-02-24 00:45:03