2011-04-10 77 views
8

我正在从一个在线流媒体平台上记录大量有关观众信息的项目。目前MySQL解决方案的问题是查询速度太慢,等等。 即使通过扩展和更好的性能调整,现在也可以工作,因为只有大量的数据是实时写入/读取的。用于日志记录的最佳NoSQL解决方案

对我来说什么是一个好的(最好的)NoSQL解决方案?

附加:

  • 目前,我们也在使用亚马逊Web服务,我们储存我们的数据。
  • 使用Java API,首选开源解决方案。
  • 面向对象。

回答

1

我会花一些时间看这些选项:

所有这些解决方案都各有和缺点,但他们的维基应该提供足够的信息来帮助你入门。

1

您可能面临的第一个挑战是如何可靠地收集海量数据并轻松管理。有一些开源日志收集器的实现,如syslog,Fluentd,ScribeFlume :)

最大的问题是如何存储和处理数据。正如您所指出的那样,使用NoSQL解决方案非常好,但您需要根据您的数据量进行选择。

起初,您可以使用MongoDB来存储您的所有数据,但是在某个时刻,您最终会使用Apache Hadoop来构建大规模可扩展架构。

这里应该有一个分布式日志记录层,它抽象出存储后端,并为数据量选择正确的NoSQL解决方案。

这里有一些链接将Apache日志放入MongoDB或Hadoop HDFS由Fluentd。