2011-03-18 85 views
1

计算超大型稀疏向量的距离/邻近矩阵的最佳方法是什么? 例如,您将得到以下设计矩阵,其中每行是68771维稀疏向量。Python中的邻近矩阵

designMatrix < 5830x68771型' 有1229041种存储的元素的稀疏矩阵在压缩稀疏行格式>

回答

1

你试过的例程scipy.spatial.distance

http://docs.scipy.org/doc/scipy/reference/spatial.distance.html

如果这迫使你去一个密集的表现,那么你可能会更好滚动您自己,取决于非零元素的密度。您可以在保留新索引与原索引之间的映射的同时挤出零点,计算其余非零元素上的成对距离,然后使用索引将事物映射回来。