2017-03-15 68 views
-5

我想在一张情节/图表中显示3种不同化妆品品牌和12个月总支出之间的客户关系。但我不确定是否所有专栏都是正确的,因为我从来没有做过这种情节,所以请求帮助。剧情需要什么数据? R

规划R.

阴谋我想我问什么是正确的列和我应该做的情节类型?

是我迄今为止的栏目有:

CUSTOMER_ID,Brand_Name_Column,12MONTH_SALES

谢谢!

+1

一般来说,这个论坛是用于询问R课题作为一种编程语言。我们没有足够的信息来帮助你。我会建议在纸上画出你想制作的情节,这将帮助你确定你需要制作情节的信息。 –

回答

1

如果您给出了plot函数1参数,它将会生成一维的barplot。

如果您给绘图函数2个值(必须是数字),它会给它一个标准的横轴与纵轴的代数图。

如果您给绘图函数3个值(2个数字和一个因子,则可以绘制点,但颜色外壳标记它们),然后使标签对用户显而易见。

基于R的内置数据集 “橙色”,就可以作出这样一个情节:

> View(Orange) 
> summary(Orange) 

情节(橙色$年龄,橙色$周长,山坳=彩虹(5)橙$树(“topleft”,title =“Orange Trees”,fill = rainbow(5),levels(),pch = 16,main =“通过圆周相关树龄”,grid(nx = 25,ny = 25)) Orange $ Tree))

注意:rainbow(5)?为什么是5?因为列树有1-5个因子。由于你有3个不同的化妆品品牌,你应该做彩虹(3)。

这就是你如何得到一个线性回归线,如果它的工作。你必须使用线性模型(LM)功能:

> model <- lm(Orange$circumference ~ Orange$age) 
> summary(model) 
> abline(model) 

Plot Function with grid and regression line

您也可以在格子库使用xyplot。

> library(xyplot) 
> xyplot(circumference ~ age| Tree, data = Orange, type = c("p", "g", "r"), main = "Plots of Orange Age vs Circumference for 5 Orange Trees") 

xyplot 3 variable plot

我没有颜色的外套我的观点,但我也没必要。虽然我喜欢这个情节,但我认为使用情节函数进行颜色涂布对于进行统计判断更好,因为它将所有因素放在同一个图中。

问题:这些功能如何工作等?

>?plot 
>?xyplot 
>?Orange 

scatterplot3d函数也很酷。您可以用它制作三维图,但您如何判断相关性受到您设置视图的“角度”的影响。

而且您还可以使用xyplot函数来制作更酷的图形。每个因子有多条回归线。

>xyplot(circumference ~ age, data = Orange, groups = Tree, type = c("p", "g", "r"), main = "Plots of Orange Age vs Circumference for 5 Orange Trees", pch = 16, auto.key = TRUE) 

enter image description here

我与我的使用auto.key命令的传说是非常可怕的。它可以改善,我敢肯定!

如果您想绘制两个变量:一个数值变量和一个因子变量,您可以这样做:使用tapply函数。在这里,我使用tapply函数来计算每棵树的所有周长。然后你使用barplot功能。这可能是你想到的。

> sum_table <- tapply(Orange$circumference, Orange$Tree, FUN = sum) 
> sum_table <- sort.default(sum_table, decreasing = TRUE, na.last = NA) 
> barplot(sum_table, xlab = "Trees", ylab = "Circumference", main = "Sum of Circumferences for all 5 Orange Trees", col = "dodgerblue1")) 

barplot_of_sums

好的,当一个数值变量与另一个因素变量中列出没关系积函数默认为使盒形图。

> plot(Orange$Tree, Orange$circumference, main = "Boxplots of Orange Circumference vs Orange Trees", xlab = "Orange Trees", ylab = "Circumference") 

Wow! Rplot makes barplots

+0

可以制作更多类型的地块,热图,镶嵌图和直方图覆盖变量的正态分布!这非常令人兴奋。使用tapply函数表明你不必重新组织你的数据框,只需做一个小小的切口即可。 – xyz123