2015-10-22 105 views
0

我有一个大型数据集(38053行=成绩单,39列=样本) 我想创建一个新的数据集,其中包含某组成绩单的所有样本值。R帮助 - 创建一个子数据集

x= data1["698568366",] 

作品单个转录物,出现的同时,“698568366”是成绩单

的名字,但现在不是一个,我想用3000

我想到了一个双床我应该能够使用:

data1[data1[,1] %in% 3000_m,] 

其中3000_m是矩阵形式的列表,

但是我不断收到回

<0 Rows> (or row.names mit Length 0) 
+2

请提供可重复的例子 – Thierry

+0

尝试'数据1 [数据1 [,1] %c(3000_m),''(未测试) – akrun

+0

data1 [! data1 [,1]%in%3000_m,] – PatriceG

回答

0

这里有数组a和b:

a = c(1:10) 
b = c(11:20) 

创建一个数据帧与他们:

df = data.frame(a, b) 

这里是我的索引作为数组:

ind = c(3, 5, 7) 

Select rows inde xed as ind:

new_df = df[ind,] 

你不能使用多维数组作为索引(据我所知)。

0

看起来您的成绩单名称实际上并未存储在数据框的第一列,而是作为行名称存储。

如果是这样的话,如果你感兴趣的成绩单的名称都存储在一个向量myTranscripts,你可以使用:

x = data1[row.names(data1) %in% myTranscripts, ]