我有一个在StringListProperty()中定义的标签列表。在App Engine上使用StringListProperty查找类似的词列表
DB包含大约100万个条目,每个条目在列表中有大约20个不同的值。
例如
一个= [ 'AB', 'BC', 'CA', 'X',....]
B = [ 'X', 'M', 'A',... ]
我使用谷歌应用程序引擎,所以我必须运行批处理作业的限制......(只允许30秒)
这里是我的问题:
给出一个列表,我想找到所有具有与......共同的元素数量最多的列表,以公共元素数量的降序排列...
我该如何用app引擎做这件事?
***更新
我存储的网址标签 - [购物,商店,社交购物,...]
基本上,我想找到它们是通过类似内容的网址
(1)匹配 (2)望着每个URL标签的频率来决定哪些URL是标签“更多”的相关内容
同样的问题... – 2011-08-03 20:10:30