我想为用户操作存储大量数据,例如喜欢,标签等(我有电子商务和文档管理计划)。易于设置的生产就绪的实时推荐引擎
随着数据点,我想支持的功能,如
- 建议
- “取类似于X,Y更多的东西”集群“谁爱X爱Y,Z的用户”。
通过生产就绪,实时性;我的意思是我可以输入数据点并同时进行查询,服务器将负责回答查询并自行更新分数。
我搜索周围的interwebs和拿出的解决方案之一:
- 数据挖掘库,大多是学术为导向,旨在为大批量操作,不重实时查询
- Hadoop/Mahout,它是生产就绪,并支持实时更新和查询,但有一个陡峭的学习曲线和难以管理。