2
我习惯于使用JSON和Numpy在python中存储数组,列表和字典,但是我想使用BSON,因为浮点数只占用4个字节,因此减少文件大小。在Python中使用BSON将浮点数组序列化/反序列化为二进制文件
使用JSON,我做了以下内容:
import numpy
import json
a = numpy.random.rand(12).reshape((3,4))
with open('out.json', 'w') as out:
json.dump(a.tolist(), out)
with open('out.json') as inp:
b = numpy.array(json.load(inp))
print b
我没有找到一个明显的方式做同样的BSON。我尝试这样做:
import numpy
from bson import BSON
a = numpy.random.rand(12).reshape((3,4))
b = BSON.encode({'a': a.tolist()})
with open('out.bson', 'wb') as out:
out.write(b)
with open('out.bson', 'rb') as inp:
print BSON().decode(inp.read())
但得到这个错误:
Traceback (most recent call last):
File "apaga.py", line 12, in <module>
print BSON().decode(inp.read())
File "/usr/lib/python2.7/dist-packages/bson/__init__.py", line 539, in decode
(document, _) = _bson_to_dict(self, as_class, tz_aware)
bson.errors.InvalidBSON: not enough data for a BSON document
它甚至没有工作,因为BSON模块没有'dumps'功能。 – heltonbiker
@heltonbiker:实际上,如果使用正确版本的bson,它确实有效。我发现DrSkippy的代码与bson-0.3.3一起工作。 – mhawke
好的,我看到了...无论如何,我很容易修改bson.SON对象以从对象字符串和相反的对象获取二进制表示。 – heltonbiker