我有一个数据集,看起来像这样:汇总数据
User | Task | Time
--------|--------|--------
User A | Task X | 100
User A | Task Y | 200
User A | Task Z | 300
User B | Task X | 400
User B | Task Y | 500
User B | Task Z | 600
User C | Task X | 700
User C | Task Y | 800
User C | Task Z | 900
User D | Task X | 1000
User D | Task Y | 1100
user D | Task Z | 1200
当我做我的初步分组,数据看起来是这样的:
| Avg User | Avg Task X | Avg Task Y | Avg Task Z
User | Time | Time | Time | Time
-------|----------|------------|------------|------------
User A | 200 | 100 | 200 | 300
User B | 500 | 400 | 500 | 600
User C | 800 | 700 | 800 | 900
User D | 1100 | 1000 | 1100 | 1200
我需要它看起来是这样的:
| Avg User | Avg Task X | Avg Task Y | Avg Task Z
User | Time | Time | Time | Time
------|----------|------------|------------|------------
All | 650 | 550 | 650 | 750
这是我如何得到这些数字:
650 = (200+500+800+1100)/4
550 = (100+400+700+1000)/4
650 = (200+500+800+1100)/4
750 = (300+600+900+1200)/4
换句话说,我有任务列组和用户行组。问题是我希望行组在额外的时间内汇总。
乍一看,我可以将用户的姓名作为“全部”返回,总结,但实际上并没有给我所需的平均值。我需要首先按用户总结时间,然后查找每个用户的平均值。如果我改变原始数据的形状,我的任务组将不再正常工作。
如果我尝试在我的行组上使用“总计”行,它将聚合原始数据而不是聚合/分组数据。这是相当令人失望的,因为它在我眼中实际上是不正确的。
我还不确定这是否能解决我的问题,但无论如何我正在学习一些东西。感谢您的反馈。 –
我已经分组了列和行。看起来,这种方法不喜欢和分组列一起工作。 –