2014-01-24 36 views
0

我对R接口非常陌生,但需要使用该程序才能运行相关分析以获得我的临床博士论文。所以,如果这是一个新手问题,请提前道歉。根据特定条件在矩阵中选择多个观测值

我有一个β甲基化值的矩阵,其维度如下:485577x894。矩阵的行名称是指以非数值和非递增顺序排列的cpg站点(例如“cg00000029”“cg00000108”“cg00000109”“cg00000165”),而列名称是指也是非参与者ID - 数值和非升序(例如“11209”“14140”“1260”“5414”)。

我想确定哪些β甲基化值> 0.5,以便我可以将它们排除在进一步分析之外。这样做,我需要数据保持矩阵格式。我所做的所有尝试来进行这种分析都导致检索整型变量而不是矩阵格式的数据。

如果有人能够请我告诉我进行此分析的代码,我将非常感激。

谢谢你的时间。

干杯,

艾丽西亚

+0

首先检查了这一点。 http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example。假设你的矩阵是'dat',你可以告诉R用'dat [dat> 0.5] < - NA'将矩阵中大于0.5的任何东西转换为'NA'。现在,根据分析,您可以使用忽略“NA”的方法。例如,请参阅''mean'中的'na.rm' –

+2

另请参阅此资源:http://cran.r-project.org/doc/manuals/r-release/R-intro.html –

+0

非常感谢为了您的回应,真的很感激。我会看看你推荐的链接。干杯,艾丽西娅 – user2828469

回答

0
set.seed(1)        # so example is reproduceable  
m <- matrix(runif(1000,0,0.6),nrow=100) # 100 rows X 10 cols, data in U[0,0.6] 
m[m>0.5]<-NA       # anything > 0.5 set to NA 
z <- na.omit(m)       # remove all rows with any NA's 
+0

非常感谢您的回复,非常感谢!我会尝试你推荐的命令! – user2828469

相关问题