我有两列数据表格,即Columns列表,即一对疾病和它们的一对。下面是disease_table1在R中绘制图表
**d1** **d2** **Value**
Disease1 Disease2 3.5
Disease3 Disease4 5
Disease5 Disease6 1.1
Disease1 Disease3 2.4
Disease6 Disease2 6.7
真实数据集1(disease_table1)低于第一个(样本数据):
Bladder cancer X-linked ichthyosis (XLI) 3.5
Leukocyte adhesion deficiency (LAD) Aldosterone synthase Deficiency 1.8
Leukocyte adhesion deficiency (LAD) Brain Cancer 1.5
Tangier disease Pancreatic cancer 0.66
我想说明这两个数据表之间的差异,同时绘制疾病对及其两个表的值。 我使用了plot函数和直线函数,但它太简单了,不能很好地区分。另外我想在绘图时有疾病对的名称。
plot(density(disease_table1$value))
lines(density(disease_table1$value))
感谢
你能否给我们提供一个[reproducable example](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)? – Jaap
我已经添加了真实的数据集,代码作为例子。 – Rgeek
400,000+疾病对可能需要一种聚类方法。你可以发布一个链接到你的数据,或更具代表性的子集,说几千条记录? – jlhoward