2017-08-11 65 views
12

我试图将一些数据可视化为饼图。我的数据结构为(Season, Int)元组列表,其中整数表示特定季节可用的项目数。如何创建一个饼图,其中元素可以属于多个切片?

难度在于一件商品可能会出现在多个季节:一件商品可能适用于秋季和冬季。

是否可以将这些信息显示为饼图?在计算百分比时,不清楚分母应该是什么,因为计数总和可能大于总项目数。

作为一个例子,使它更清晰,假设我有10个项目。一个有效的数据集可能是:

  • (秋季,4)
  • (冬天,5)
  • (夏季,3)
  • (春,10)

总数在这里代表的项目是22,但真正只有10个项目。

计算下降比例为4/10并不合理,但4/22也没有。

此数据是否与饼图(或其他面向比例的图表)不兼容?

+0

你为什么认为'4/22'百分比没有意义?这是秋季季节物品“出现次数”的百分比......编辑:是否有意义取决于一个季节的“物品可用性”是什么意思,以及所代表的是什么。假如说,如果目的是比较每个赛季戏剧表演的数量,那么4/22是有意义的。 –

+0

这是您拥有的所有数据还是您有计算项目出现的类别的方法? – 7hibault

+0

@ 7hibault是原始数据的类型是[[(Season,Item)]' – Bill

回答

1

这取决于情节试图表示什么业务问题。我们在数据可视化中使用了最佳实践。这些最佳实践受统计和人类认知的指导。我们希望剧情能够立即讲述故事。

阅读您的文章,看起来您正在尝试回答的业务问题是:相对于公司拥有的项目总数(总数),每个季节的可用项目百分比是多少。使用邮件中的数字可以在春天获得100%的项目,冬天只有50%的项目可用。

这是一个伟大的业务问题,可视化(如果这确实是您试图解决的业务问题),但您无法使用饼图。饼图必须表示100%。条形图很适合比较,我建议您使用它们。您可以使y轴单位为百分比,沿x轴有4个小节。

条形图不必(统计)增加到100%,但如果您担心人们可能会对此产生疑问,则可以通过将y轴作为项目数量的计数来获得相同的效果在每个季节。情节仍然会显示每个季节可用物品的相对数量。这是在这种情况下使用条形图的另一个很好的理由。

最后,请注意,饼图看起来不错,但它们也不是从人类感知的角度推荐的。我们很难比较切片的相对大小。

+0

不客气@Bill。这是一个值得思考的问题。 – Rahav

相关问题