4
当我试图挽救一个非常大(20000 X 20000元)阵列,我得到的所有零回:numpy的TOFILE()具有非常大的数组保存所有零
In [2]: shape = (2e4,)*2
In [3]: r = np.random.randint(0, 10, shape)
In [4]: r.tofile('r.data')
In [5]: ls -lh r.data
-rw-r--r-- 1 whg staff 3.0G 23 Jul 16:18 r.data
In [6]: r[:6,:6]
Out[6]:
array([[6, 9, 8, 7, 4, 4],
[5, 9, 5, 0, 9, 4],
[6, 0, 9, 5, 7, 6],
[4, 0, 8, 8, 4, 7],
[8, 3, 3, 8, 7, 9],
[5, 6, 1, 3, 1, 4]])
In [7]: r = np.fromfile('r.data', dtype=np.int64)
In [8]: r = r.reshape(shape)
In [9]: r[:6,:6]
Out[9]:
array([[0, 0, 0, 0, 0, 0],
[0, 0, 0, 0, 0, 0],
[0, 0, 0, 0, 0, 0],
[0, 0, 0, 0, 0, 0],
[0, 0, 0, 0, 0, 0],
[0, 0, 0, 0, 0, 0]])
np.save()做类似的奇怪的东西。
搜索网后,我发现有在OSX一个已知的bug:
https://github.com/numpy/numpy/issues/2806
当我尝试使用Python的读取来读取一个文件中的ToString()数据()我收到一个内存错误。
有没有更好的方法来做到这一点?任何人都可以推荐一个务实的解决方法来解决这个问题吗?