我是新来的stackoverflow和数据库。现在我有一个项目,我想执行关联规则分析。我在制作分析矩阵方面遇到了一些麻烦。我的数据看起来像这样:从“平面表”中计算矩阵
第1栏:收据编号,第2列:品牌第3列:已购买或未购买。
我想获得一个矩阵,其中receiptnumbers是行,品牌是列。我不得不说,并非每个收据号码都包含所有品牌。
我是新来的stackoverflow和数据库。现在我有一个项目,我想执行关联规则分析。我在制作分析矩阵方面遇到了一些麻烦。我的数据看起来像这样:从“平面表”中计算矩阵
第1栏:收据编号,第2列:品牌第3列:已购买或未购买。
我想获得一个矩阵,其中receiptnumbers是行,品牌是列。我不得不说,并非每个收据号码都包含所有品牌。
我认为这个答案和创建表一样简单。我将提供一个MWE:
data <- data.frame(receiptnumber = c('1', '1', '2', '3', '4'),
brand = c('A', 'A', 'B', 'C', 'D'))
print(data)
# receiptnumber brand
# 1 1 A
# 2 1 A
# 3 2 B
# 4 3 C
# 5 4 D
tabData <- table(data$receiptnumber, data$brand)
print(tabData)
# A B C D
# 1 2 0 0 0
# 2 0 1 0 0
# 3 0 0 1 0
# 4 0 0 0 1
普通索引仍然有效
tabData[1,3]
# 0
喜冰霜蛆,我试过你上面提到的东西。当我试图运行它时,Rstudio给出了以下错误:“无法分配1.9 GB大小的矢量,当我看到这种情况发生时,我试图做出一个小子集(总共791个观察值)并再次运行它。错误,所以我认为还有另外一个问题,但是我找不到它,R应该很简单地用一个很少的数据点组成矩阵吗?你知道我怎么解决这个问题吗?感谢你的帮助顺便说一句,对于R程序设计的初学者来说,这对于某些经验丰富的人士来说是非常棒的 – Jasper1989
请提供[重复的例子(http://stackoverflow.com/questions/5963269/how-to-make-一个很好的再现性例子)以及预期的输出 – digEmAll
欢迎来到SO。请阅读[如何问一个好问题](http://stackoverflow.com/help/how-to-ask),当然如何给[可重现的例子](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example) – Sotos