2014-11-03 118 views
0

问题:我目前使用python-recsys和SVD算法来计算我的用户建议推荐引擎的简单,但数据沉重的Web应用程序

。计算是相当快的(现在),但我想知道如果我们活着会如何表现。我们有大约100万个产品存储在Mongodb中,预计大约有100个用户可以开始使用。我已经模拟了类似的情况,但这种随机生成的数据实际上并不适用于真实情况。

我们使用Redis的建议进行储存,他们在计算任务芹菜每2小时,目前是真正的内存沉重,尽管我做了我所能对其进行优化。

担心将来我打算使用的Neo4j该任务虽然这是很难找到使用这个分贝建议开发商任何现实生活中的故事。

一般来说我想达成的目标是合理的工作推荐引擎(象夫会矫枉过正,在这种情况下,我猜),这是不是真的内存,因为我们无法承受许多服务器。

如何将Neo4j的那个问题打?那个数据库有没有好的Python驱动程序?也许最好是使用当前的Mongodb/Redis解决方案并调整它一点,而不是将另一个数据库添加到当前堆栈?我也在考虑使用单独的机器进行纯粹的推荐计算 - 但这是一个不错的选择吗?

回答

1

担心将来我打算使用的Neo4j该任务虽然 这是很难找到的使用 这个分贝建议开发商任何现实生活中的故事。

http://seenickcode.com/switching-from-mongodb-to-neo4j/

如何将Neo4j的那个问题打?那个db有没有好的python 驱动?

http://neo4j.com/developer/python/

+0

下面是一个推荐引擎的一个示例:http://neo4j.com/developer/guide-build-a-recommendation-engine/有更多的例如在http://maxdemarzi.com – 2014-11-04 09:08:16