2015-06-10 63 views
-3

我有账户数据记录(比如唯一的400条记录)。每个记录有三个不同的迹象表明溢价。对于每一条记录,我都关心这些指示如何相互比较。在某些情况下,适应症可能全部相对符合,而在其他3种适应症中则是不稳定的,而且非常不同。这些记录也有一个与它们相关的状态。在R中绘制3.1.2

无论如何,我想知道是否有一个很好的方式来可视化3种迹象之间的记录差异。此外,是否有一种很好的方式来显示状态的指示差异(也许在R?中的地图状视图中)。

我已经作图使用密度图,其是有帮助的每个单独的指示的分布,但在这里,我询问的差异可视化 1,2,或所有3个指示为每个记录之间。我问的是可能的吗?

非常感谢。

+1

更多的人将能够如果您提供样本数据,可以帮助您。此外,您是否对所有可能的差异感兴趣(例如1对2,1对3,2对3)?订单是否重要? – JasonAizkalns

+1

那么你的问题是什么? “......如果有一种很好的方式来形象化......”?如果是这样,答案是 - 是的,有一个很好的方法。请发布示例数据我们可以帮助您更多。 – PoGibas

+0

原谅我,但发布样本数据的最佳方式是什么?另外,@JasonAizkalns,是的,我对所有可能存在的差异感兴趣(除非有其他方法可以做到这一点,相关性可能?),顺序无关紧要。另外,我认为适应症之间的差异比标称差异更有帮助。 – ActuaryGuy

回答

1

也许这样的事情是你以后,但是这会更容易些,如果你能提供的样本数据,并在你所要求的具体问题更具描述:

library(ggplot2) 
library(dplyr) 
library(tidyr) 

df <- data.frame(id = 1:400, 
       state = state.abb, 
       ind1 = rnorm(400), 
       ind2 = rnorm(400), 
       ind3 = rnorm(400)) 

df %>% 
    mutate(diff_1_2 = ind1 - ind2, 
     diff_1_3 = ind1 - ind3, 
     diff_2_3 = ind2 - ind3) %>% 
    gather(metric, value, -c(id, state)) %>% 
    filter(metric %in% c("diff_1_2", "diff_1_3", "diff_2_3")) %>% 
    ggplot(., aes(x = metric, y = value)) + 
    geom_boxplot() + 
    facet_wrap(~ state) 
+0

我能够修改此代码以获取我所需要的内容,我是对R来说还是很新的,所以这对我来说是一个很好的学习体验,非常感谢!但是,我还有一个额外的问题,现在是否可以在每个状态图上添加每个给定图的底层观察数? – ActuaryGuy