2
什么是更可伸缩的方式从项目集列表::蟒蛇大熊猫数据帧
itemset = [['a', 'b'],
['b', 'c', 'd'],
['a', 'c', 'd', 'e'],
['d'],
['a', 'b', 'c'],
['a', 'b', 'c', 'd']]
去这种::
>>> df
a b c d e
0 1 1 0 0 0
1 0 1 1 1 0
2 1 0 1 1 1
3 0 0 0 1 0
4 1 1 1 0 0
5 1 1 1 1 0
>>>
DF的目标大小的数据帧是1e6行和500列。
对称问题是http://stackoverflow.com/q/38605111/3313834 – user3313834