2017-02-06 78 views
-3

我是新来的stackoverflow和数据库。现在我有一个项目,我想执行关联规则分析。我在制作分析矩阵方面遇到了一些麻烦。我的数据看起来像这样:从“平面表”中计算矩阵

第1栏:收据编号,第2列:品牌第3列:已购买或未购买。

我想获得一个矩阵,其中receiptnumbers是行,品牌是列。我不得不说,并非每个收据号码都包含所有品牌。

+0

请提供[重复的例子(http://stackoverflow.com/questions/5963269/how-to-make-一个很好的再现性例子)以及预期的输出 – digEmAll

+0

欢迎来到SO。请阅读[如何问一个好问题](http://stackoverflow.com/help/how-to-ask),当然如何给[可重现的例子](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example) – Sotos

回答

0

我认为这个答案和创建表一样简单。我将提供一个MWE:

data <- data.frame(receiptnumber = c('1', '1', '2', '3', '4'), 
        brand = c('A', 'A', 'B', 'C', 'D')) 

print(data) 

# receiptnumber brand 
# 1    1  A 
# 2    1  A 
# 3    2  B 
# 4    3  C 
# 5    4  D 

tabData <- table(data$receiptnumber, data$brand) 

print(tabData) 

# A B C D 
# 1 2 0 0 0 
# 2 0 1 0 0 
# 3 0 0 1 0 
# 4 0 0 0 1 

普通索引仍然有效

tabData[1,3] 

# 0 
+0

喜冰霜蛆,我试过你上面提到的东西。当我试图运行它时,Rstudio给出了以下错误:“无法分配1.9 GB大小的矢量,当我看到这种情况发生时,我试图做出一个小子集(总共791个观察值)并再次运行它。错误,所以我认为还有另外一个问题,但是我找不到它,R应该很简单地用一个很少的数据点组成矩阵吗?你知道我怎么解决这个问题吗?感谢你的帮助顺便说一句,对于R程序设计的初学者来说,这对于某些经验丰富的人士来说是非常棒的 – Jasper1989