我有3个数据集(txt.gz),我已经对它们进行了子集化,使其仅包含p值为1 * 10^-6或更小的观测值。过滤掉3个数据集之间的常见观测值
下一步是检查一个通用名称变量(名称是指SNPs,遗传学)。
当前表:
name pval
rs2575876 8.20660e-07
rs11834972 4.20460e-07
rs11050138 4.23080e-07
rs12313631 7.13600e-07
rs485538 5.99060e-07
任何想法?
您可以发布'头(your.data)'所有名称中出现多个数据集? – Nishanth 2013-04-11 14:47:27
你的问题不清楚。你的三个数据帧格式是什么? (显示你到目前为止的代码将有助于澄清问题)。 “......具有p值的常见SNP中的SNP”是什么意思? – 2013-04-11 14:47:28
我猜'%in%'是你的朋友。 – eddi 2013-04-11 15:23:46