2012-10-23 10 views
-1

我有22810行9列(类型的启动子)和数据的子集的RMA归一化的基因表达datset如下:hierarchial聚类的在r中的基因表达

ID_REF GSM362180 GSM362181 GSM362188 GSM362189 GSM362192 
244901 5.094871713 4.626623079 4.554272515 4.748604391 4.759221647 
244902 5.194528083 4.985930299 4.817426064 5.151654407 4.838741605 
244903 5.412329253 5.352970877 5.06250609 5.305709079 8.365082403 
244904 5.529220594 5.28134657 5.467445095 5.62968933 5.458388909 
244905 5.024052699 4.714631878 4.792865831 4.843975286 4.657188246 
244906 5.786557533 5.242403911 5.060605782 5.458148567 5.890061836 

我想要做上述的以及聚类试图分级聚类:

d <- dist(as.matrix(deg), method = "euclidean") 

其中度是差异表达的基因(4300号)。而我得到以下警告的矩阵:

Warning message: 
In dist(as.matrix(deg), method = "euclidean") : NAs introduced by coercion 

在警告的情况下进行聚类是否合适?

hc <- hclust(d) 
plot(hc, hang = -0.01, cex = 0.7) 

我得到一个树状图,这是非常密集和标签不明确:此外,我不知道该9个促销员的分类树的几个基因:它是如何将有可能标记树与发起人以及如何将基因可视化为更清晰的树状图? Iam不确定我是否需要在这里添加树状图。

+0

它是如何将有可能再现这里整个数据? –

+0

是的,我尝试了20和500升级我仍然得到相同的错误。 –

+0

我已经完全尝试过在问题中发布的同一个(对于6行和5列)并仍然出现错误。 –

回答

1

继您的评论后,我无法重现您的错误。我读的数据:

##Read in the data 
deg = read.table(textConnection("ID_REF GSM362180 GSM362181 GSM362188 GSM362189 GSM362192 
244901 5.094871713 4.626623079 4.554272515 4.748604391 4.759221647 
244902 5.194528083 4.985930299 4.817426064 5.151654407 4.838741605 
244903 5.412329253 5.352970877 5.06250609 5.305709079 8.365082403 
244904 5.529220594 5.28134657 5.467445095 5.62968933 5.458388909 
244905 5.024052699 4.714631878 4.792865831 4.843975286 4.657188246 
244906 5.786557533 5.242403911 5.060605782 5.458148567 5.890061836"), header=TRUE) 

然后我可以计算距离矩阵:

R> dist(as.matrix(deg), method = "euclidean") 
     1  2  3  4  5 
2 1.173       
3 4.266 3.701     
4 3.423 2.288 3.120    
5 4.011 3.038 4.312 1.814  
6 5.282 4.204 3.912 2.109 1.957 
+0

我想我在读取数据时发生错误。非常感谢你。 –

+0

为什么textConnection被用来读取数据? –

+0

因为你没有提供简单的方法来导入你的数据,所以把它复制到一个字符串中,然后告诉R它是一段文本,它应该正确解析它,这是获取数据的最简单方法。你可以[阅读此](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)以获取更多关于如何制作一个好的重现性示例的信息。 – Dason