我正在从一个在线流媒体平台上记录大量有关观众信息的项目。目前MySQL解决方案的问题是查询速度太慢,等等。 即使通过扩展和更好的性能调整,现在也可以工作,因为只有大量的数据是实时写入/读取的。用于日志记录的最佳NoSQL解决方案
对我来说什么是一个好的(最好的)NoSQL解决方案?
附加:
- 目前,我们也在使用亚马逊Web服务,我们储存我们的数据。
- 使用Java API,首选开源解决方案。
- 面向对象。
我正在从一个在线流媒体平台上记录大量有关观众信息的项目。目前MySQL解决方案的问题是查询速度太慢,等等。 即使通过扩展和更好的性能调整,现在也可以工作,因为只有大量的数据是实时写入/读取的。用于日志记录的最佳NoSQL解决方案
对我来说什么是一个好的(最好的)NoSQL解决方案?
附加:
不完全是NoSQL解决方案,但你看过Scribe(来自Facebook)?您可以使用http://code.google.com/p/scribe-log4j/从Java
写您可能面临的第一个挑战是如何可靠地收集海量数据并轻松管理。有一些开源日志收集器的实现,如syslog,Fluentd,Scribe和Flume :)
最大的问题是如何存储和处理数据。正如您所指出的那样,使用NoSQL解决方案非常好,但您需要根据您的数据量进行选择。
起初,您可以使用MongoDB来存储您的所有数据,但是在某个时刻,您最终会使用Apache Hadoop来构建大规模可扩展架构。
这里应该有一个分布式日志记录层,它抽象出存储后端,并为数据量选择正确的NoSQL解决方案。
这里有一些链接将Apache日志放入MongoDB或Hadoop HDFS由Fluentd。