2014-12-05 51 views
1

我使用Django来管理机器学习过程。在计算阶段结束时,我剩下一个巨大的矩阵数据(大约50MB的浮点数)。我应该将它存储在我的Django模型(二进制字段?)还是存储在文件(FileField)中?这两种选择似乎有优点和缺点。Django:将巨大的矩阵存储在表或文件中?

我的具体案例:我只需要在培训完成后写入数据,并在每次使用学习模型时将其加载到内存中。没有查询。只需读取矩阵中的整个数据并在表格/文件中写入矩阵。

回答

0

感谢您回复!

我正在根据您的使用情况调整我的答案。

既然你只需要训练后每次写入数据时,你应该尝试this

+0

感谢高塔姆,我觉得这是一个有点矫枉过正,是不是?我关心的不是速度或性能,我只是想存储一个矩阵,问题是:在哪里? (网上阅读:“不要开始使用Redis或任何其他缓存,直到你需要速度 - 不要过早优化”) – Patrick 2014-12-05 18:56:44

+0

它的工作原理。我用分隔列的逗号来编写数字,分隔行的分号。之后,我可以使用numpy.matrix(数据)将数据加载到矩阵中。我不知道它是否非常有效,但它的工作原理。谢谢高塔姆。 – Patrick 2014-12-05 20:43:19

+0

总是乐意帮助....请尽情享受 – 2014-12-06 03:53:34