2016-07-11 158 views
0

我正在寻找一个分布式实时计算系统,它将从kafka服务器收集数据,以便处理数据,然后将其存储在ElasticSearch中。我已经选择其中的一些:logstash和apache storm/spark streaming之间的主要区别是什么?

  • 阿帕奇风暴
  • 阿帕奇火花流
  • 和Logstash(其更descripted作为ETL(提取,转换,负载))

我已经发现了几个比较Storm和Spark Streaming的教程。但是,我没有找到任何教程比较logstash风暴和火花流。这对我来说非常困惑,因为我已经熟悉logstash,但我想确保为我的需要选择正确的工具。

预先感谢您

回答

2

Logstash是具有实时功能的数据收集引擎。它支持分析,存档,监控,警报......基于一些预定义的指标。 - > Logstash是一种特定的产品,解决方案 Apache Spark和Storm是非常通用的分布式实时计算系统。 - > Apache Spark/Storm只是一般用途的框架/库。

+1

好的谢谢。与暴风雨和火花流相比,在什么情况下logstash可能不够用?此外,它在分配的表演方面是否有更好的进展? –

+0

我只需要了解为什么像Twitter这样的公司使用风暴或火花流而不是logstash。对我来说,他们似乎做同样的事情.. –

+0

让我们看看github上的定义:https://github.com/elastic/logstash。 “Logstash是一个管理事件和日志的工具,你可以用它来收集日志,解析它们并存储起来以备后用(比如搜索),如果你将它们存储在Elasticsearch中,你可以使用Kibana查看和分析它们。 – NangSaigon

相关问题