我试图确定有多少人购买了可以存在的所有不同产品对中的一对商品。例如。我有三种产品,A,B,C和我想确定有多少%的客户在每个国家/地区拥有两种产品的客户数量中购买了A和B,B和C以及A和C。SQL:跨产品
我的表格如下所示。
Customer | Country | Product
1 | US | A
1 | US | B
2 | CA | A
2 | CA | C
3 | US | A
3 | US | C
4 | US | B
5 | US | A
请注意,客户只能属于一个国家。
我的期望的输出是:
Country | Pair | %
US | A_B | 25%
US | B_C | 0%
US | A_C | 25%
CA | A_B | 0%
CA | B_C | 0%
CA | A_C | 100%
的%基本上是比
(# of unique customers who bought Product1 and Product2)/
(# of unique customers who bought Product1 or Product2)
由国家。
因此,例如,在美国A_B
我们有4个谁买了这些A
或B
但只买了1两A
和B
所以比1/4
客户。
有没有一个很好的解决方案,如果我有一个大数目,任意数量的配对可以扩展?
您是否需要每个国家的输出?或者“请注意,客户只能属于一个国家”的意义何在? – JanR
所以,你已经完全改变了这个问题。以下所有答案现在都不相关。你应该已经创建了一个新的问题,因为截至目前似乎答案不会产生预期的结果 – cha