2013-03-14 69 views
2

我在Python 2.6中有一个例程,它在AWS DynamoDB数据库中存储大量html文本,问题在于这些“blob”是吸吮当做简单的检索时,需要大量的空间和计算单元,所以我正在寻找将字符串压缩成更轻量级的方法。python/php - 跨语言字符串压缩(使用gzcompress/urlencode/json)

我已经做了一些简单的测试,它可以工作(极大地减少了DynamoDB计算单元),但是我正在寻找关于这是否是最好的方法的输入。

以下是我用来生成纯文本gzip压缩版本的json数组的Python 2.6代码。 json数组包含几个键,每个键都有一个大的html。

import urllib, json 
str = urllib.quote(json.dumps({'foo1': 'bar'}).encode('zlib').encode('base64')) 

然后用PHP,我可以运行下面的字符串恢复到自然数组:

json_decode(gzuncompress(base64_decode(urldecode($str))),1); 

没有人有任何提示或这是实现我目标的最佳方式是什么?

+0

+1为工作代码。 – 2013-03-14 15:03:52

+0

thx,我在发布更好的问题上越来越好:) – Joe 2013-03-14 15:04:35

+0

是否需要使用Base64对字符串进行编码?否则,你的解决方案似乎是一个很好的解决方案。如果没有人提出一个更好的想法,请回答自己的问题问答风格,并重新修改您的原始问题以匹配。 – javex 2013-03-14 15:05:20

回答