描述:我有一个巨大的MySQL数据库表。总大小约为10兆兆字节。它只包含文本。任何方式来减少文字的大小?
从这个数据库表中的示例文本:
在其他情况下,一些国家也逐渐学会了生产同样的产品,并且以前只有美国等少数国家能够生产服务。美国实际收入增长放缓。
约有500亿不同的文字。
我试过了什么?
我试过将它们全部压缩。事实上,它已经工作,减少了总大小。但是,我需要进行搜索,并且在位于zip文件中时我无法搜索任何数据。
我试过PHP的base64
编码。它使我的示例文本数据为:
SW4gb3RoZXIgY2FzZXMsIHNvbWUgY291bnRyaWVzIGhhdmUgZ3JhZHVhbGx5IGxlYXJuZW QgdG8gcHJvZHVjZSB0aGUgc2FtZSBwcm9kdWN0cyBhbmQgc2VydmljZXMgdGhhdCBwcmV2 aW91c2x5IG9ubHkgdGhlIFUuUy4gYW5kIGEgZmV3IG90aGVyIGNvdW50cmllcyBjb3VsZC Bwcm9kdWNlLiBSZWFsIGluY29tZSBncm93dGggaW4gdGhlIFUuUy4gaGFzIHNsb3dlZC4 =
我想什么来实现?
我想在发送到MySQL之前减少文本的大小。首先,我不知道我能做这份工作。我正在考虑加密和解密数据。
所以,这里是我想要做的一个例子:
我想在存储之前对文本数据进行加密。然后,我想调用来自MySQL的加密数据来解密。
任何可以缩小文字大小的方法? Base64不适合我,有没有其他方法?
你需要全文检索吗?在这种情况下,你不能压缩或你的MySQL将无法抓取文本。无论如何,在这里粘贴你的数据库内容。 – moonwave99
也许Lucene http://lucene.apache.org/是你正在寻找的。它是为你试图从事的事情而设计的:搜索大量文本 –
是的,我确实需要全文搜索。 –