2013-03-21 226 views
3

这是一个较大的脚本的一部分 - 长篇故事的简短部分,输入到R是分号分隔的路径,以指向我的文本文件的位置。所有文本文件格式如下:在for循环中添加列R

文件1:

Name1 3 
Name2 4 
Name3 55 

文件2:

Name1 4 
Name2 33 
Name3 102 

文件3:

Name1 12 
Name2 2 
Name5 33 

下面是一个例子:

cond1<-'/User/Desktop/File1;/User/Desktop/File2;/User/Desktop/File3' 

#separates the elements 
normalList<-strsplit(cond1, ";") 

#now you can access each element 
nor<-unlist(normalList) 

baseNorm<-vector("list", length(nor)) 
dirNorm<-vector("list", length(nor)) 
pathNorm<-vector("list", length(nor)) 
Norm<-vector("list", length(nor)) 
new<-vector("list", length(nor)) 
for (i in 1:length(nor)) 
{ 
    baseNorm[[i]] <- basename(nor[i]) 
    dirNorm[[i]]<-dirname(nor[i]) 
    pathNorm[[i]]<-paste(dirNorm[[i]], baseNorm[[i]], sep="/") 
    Norm[[i]]<-read.delim(pathNorm[[i]], header=F) 

} 

在这里的示例中,对R的输入包含3个文件,但是我需要足够灵活的脚本,以便可以传递任意数量的文件,因此可以使用for循环。大的想法是: 1)获取所有文件的特定文件的路径。 2)将文本文件加载到R 3)创建一个包含公共第一列(Name1,Name2,Name3)的新文件。在所有新文件中的下一列对应于文件1,文件2,文件3,FILE4等的第2列 从本质上讲,我需要创建一个主文件:

Name1 3 4 55 
Name2 4 33 102 
Name3 12 2 33 

我相信有一个更简单解决方案,甚至到我已经拥有的代码,因为所有的[[]]我都不知道如何开始编写一个创建主文件的函数。我刚开始使用R,所以任何输入都是有价值的学习体验,并且预先感谢您!

+0

'list.files'(参见参数模式),'lapply'和'do.call'是关键字。 – 2013-03-21 23:18:22

回答

3

这样的事情? :

fileNames <- list.files() 

master1 <- read.csv(file = fileNames[1], sep = ";", header = T)  

for(i in 2:length(fileNames)){  
file1 <- read.csv(file = fileNames[i], sep = ";", header = T) 
master1$newCol1 <- file1[,2] 
colnames(master1)[ncol(master1)] <- paste("file",i,sep = "") 
} 
+1

为什么不使用'[[''而不是'''',那么你不必使用'colnames'-' – mnel 2013-03-21 23:39:54

+0

'我不熟悉'[['。它有什么作用? – screechOwl 2013-03-22 00:08:11

+0

请参阅'?“[['''和'library(fortune); fortune(312)' – mnel 2013-03-22 00:12:08

1

我意识到我可能有点含糊。以下是一些可能有所帮助的半伪代码。

my.files <- list.files(pattern = ".csv") 
imported.files <- sapply(my.files, read.csv, ...) # additional paramaters for proper import 
out <- do.call("cbind", imported.files)