我有一个数据帧像这样:[R重塑宽长数据
[1] "drugevent" "prr" "prr_lowerCI" "prr_upperCI" "EBGM"
[6] "EBG_lowerCI" "EBGM_upperCI" "strata.coded" "strata" "Reference"
我想为每个drugevent情节,使用ggplot。为了做到这一点,我需要格式化我DF像这样:
[1] "drug", "event", "measurement"(prr or EBGM), "lowerCI"(for coresponding measurement), upperCI, strata
但是,尽管对这样的许多职位,或R教程我无法corectly重塑数据。在我的最后一次尝试我添加了一个ID如下:
mutate(DF, count=1:n())
融化的数据
melt(DF, id.vars="count")
然后我提出了一些话语结构子集化的利益
subset(melted, variable in c("prr","EBGM"))
然后上下值置信区间,地层和药物事件, 但当我合并他们这样的:
merge(measurement, lowerCI, by="count")
最后我重复了每行4行的值。 代码混乱,结果是错误的。你能帮我解决这个问题吗?
编辑exampples: 初始数据:
drugevent prr prr_lowerCI prr_upperCI
1 CLARITHROMYCIN-Erythema Multiforme 1.3539930 0.1903270 2.517659
2 CLARITHROMYCIN-Erythema Multiforme 1.7741342 0.6647390 2.883529
EBGM EBG_lowerCI EBGM_upperCI strata count
1 0.9003325 0.2128934 2.772558 Infants 1
2 1.4471096 0.5997188 3.053965 Children 2
期望的结果:
measurement value upperCI strata drug
1 prr 1.353992979 2.51765895 Infants CLARITHROMYCIN
2 EBGM 0.9009 2.77 Infants CLARITHROMYCIN
reaction lowerCI
1 Erythema Multiforme 2.51765895
2 Erythema Multiforme 1.447
请包括一个最小的测试数据帧和预期的变换 – jMathew
第一个元素甚至不是'data.frame',它是一个向量。 – gregmacfarlane