2010-07-14 26 views
1

我有一个在StringListProperty()中定义的标签列表。在App Engine上使用StringListProperty查找类似的词列表

DB包含大约100万个条目,每个条目在列表中有大约20个不同的值。

例如

一个= [ 'AB', 'BC', 'CA', 'X',....]

B = [ 'X', 'M', 'A',... ]

我使用谷歌应用程序引擎,所以我必须运行批处理作业的限制......(只允许30秒)

这里是我的问题:

给出一个列表,我想找到所有具有与......共同的元素数量最多的列表,以公共元素数量的降序排列...

我该如何用app引擎做这件事?

***更新

我存储的网址标签 - [购物,商店,社交购物,...]

基本上,我想找到它们是通过类似内容的网址

(1)匹配 (2)望着每个URL标签的频率来决定哪些URL是标签“更多”的相关内容

+0

同样的问题... – 2011-08-03 20:10:30

回答

0

我不认为有任何整洁的方式在应用程序做到这一点引擎 - 或者就此而言,在任何带有onl的DBMS中y可用的标准一维索引。

也许如果你扩展你想要达到的目标,有人可以建议一个替代方案?

+0

更新了上述问题。 – demos 2010-07-21 17:21:09