0
管道的数据输入来自数据库或Web记录器。管道处理它并放入HDFS并将数据移动到NoSQL数据库。监测系统将监测这个端到端。如何在Hadoop集群中设置数据管道监控系统?
管道的数据输入来自数据库或Web记录器。管道处理它并放入HDFS并将数据移动到NoSQL数据库。监测系统将监测这个端到端。如何在Hadoop集群中设置数据管道监控系统?
您可以考虑使用ELK堆栈(ElasticSearch,Logstash,Kibana)。在每个节点上,接收,处理并插入到数据库中,请查看您是否可以添加关于您要处理的每个文件/记录的日志。
您可以在每个节点上部署logstash并为其编写解析逻辑,将它们写入ElasticSearch并使用Kibana可视化这些逻辑。
您还可以考虑使用Elastic.co的Watcher插件在出现错误时生成警报。
以下是一些可供您开始使用的链接。