0
我正在寻找一个分布式实时计算系统,它将从kafka服务器收集数据,以便处理数据,然后将其存储在ElasticSearch中。我已经选择其中的一些:logstash和apache storm/spark streaming之间的主要区别是什么?
- 阿帕奇风暴
- 阿帕奇火花流
- 和Logstash(其更descripted作为ETL(提取,转换,负载))
我已经发现了几个比较Storm和Spark Streaming的教程。但是,我没有找到任何教程比较logstash风暴和火花流。这对我来说非常困惑,因为我已经熟悉logstash,但我想确保为我的需要选择正确的工具。
预先感谢您
好的谢谢。与暴风雨和火花流相比,在什么情况下logstash可能不够用?此外,它在分配的表演方面是否有更好的进展? –
我只需要了解为什么像Twitter这样的公司使用风暴或火花流而不是logstash。对我来说,他们似乎做同样的事情.. –
让我们看看github上的定义:https://github.com/elastic/logstash。 “Logstash是一个管理事件和日志的工具,你可以用它来收集日志,解析它们并存储起来以备后用(比如搜索),如果你将它们存储在Elasticsearch中,你可以使用Kibana查看和分析它们。 – NangSaigon