我从sklearn袋式矢量化器中有一个稀疏矩阵。它是一个csr_matrix,其元素表示文档中的词频。但现在我需要的是0/1矩阵,其中1代表文档中存在的单词,所以我不关心实际的频率。 忽略的背景问题,是这样的: 我有一个稀疏矩阵,如何将一个整数值稀疏矩阵转换为0/1值稀疏矩阵,Python
2 3 4 0 0 0
0 0 0 0 0 8
0 0 0 2 0 0
0 0 0 0 0 0
我希望所有的非零元素为1,
1 1 1 0 0 0
0 0 0 0 0 1
0 0 0 1 0 0
0 0 0 0 0 0
我怎样才能做到这一点?我假设使用todense(),然后循环不是一个好的选择,因为稀疏矩阵很大。有没有更好的办法?
谢谢!它的工作 –