我在群集中有> 10个节点。我使用Cloudera(YARN,HBase,Hue,Hadoop FS,Spark,Flink)在群集上安装了Hadoop堆栈。是否有一种简单的方法来收集所有节点的全局统计信息(就CPU使用情况,内存使用情况和网络使用情况而言)并使用Python进行读取?使用Python的目的是,我可以完全自由地指定绘图并确保在报告中使用统一的绘图风格。我可以使用哪些软件来完成此操作?它不必分发,只需一个简单的库就足够了。监视节点群集
监视节点群集
回答
我做了一个包装自己:http://github.com/kevin91nl/isa
的讲解可以https://www.data-blogger.com/2016/07/18/monitoring-your-cluster-in-just-a-few-minutes/
如果有人知道一个更好的选择,可以发现,请让我知道。
我希望神经节能满足要求。但是仍然应该在集群中的所有节点上进行配置。 –
为了这个目的,我建议考虑使用ansible。 下面是一个简单playbook收集在inventory file指定的主机上的一些数据,并将其添加到本地文件:
- hosts: all
remote_user: your_user
tasks:
- name: collect load average
shell: cat /proc/loadavg
register: cluster_node_la
- name: write to local disk
lineinfile: dest=/tmp/cluster_stat create=yes line="{{ ansible_fqdn }}:{{ cluster_node_la.stdout_lines }}"
delegate_to: 127.0.0.1
可以按照如下运行: ansible-playbook -i ansible-inventory stats-playbook.yml --forks=1
- ansible_inventory是文件包含您的主机列表
- stats-playbook.yml是上面打印的文件
当然,取决于你将如何存储收集的数据,它可能以不同的方式实现,但我认为总体思路是明确的。无论如何,有很多方法可以解决它在ansible。
此外,ansible有python API,你可以直接从python做大多数事情!即,这是我们可以收集群集的配置:
import pprint
import ansible.runner
import ansible.inventory
inventory_file = 'ansible_inventory' # see ansible inventory files
inventory = ansible.inventory.Inventory(inventory_file)
runner = ansible.runner.Runner(
module_name='setup',
module_args='',
pattern='all',
inventory=inventory
)
cluster_facts = runner.run()
pprint.pprint(cluster_facts)
看起来很棒!谢谢 :-) –
- 1. Ganglia监控Hadoop多节点群集
- 2. 节点群集
- 3. Zookeeper的节点数是否独立于要监视的群集的节点数?
- 4. 如何监视zookeeper群集
- 5. Zookeeper集群监视器
- 6. 节点群集和/或Docker群集?
- 7. 单节点群集在多节点群集上工作?
- 8. 将2节点cassandra集群转换为1节点集群
- 9. 删除SQL群集节点
- 10. 2节点的Cassandra集群
- 11. 恢复oracle群集节点
- 12. 4节点集群查询
- 13. Hadoop多节点群集
- 14. Hazelcast群集更新节点
- 15. Hadoop的2节点集群
- 16. Cassandra集群与节点
- 17. cloudera群集节点角色
- 18. h2o群集多节点
- 19. RabbitMQ集群节点故障
- 20. Vertica C.E.集群节点号?
- 21. Cassandra集群单节点
- 22. 编写一个系统来监视集群中的所有节点
- 23. 多节点群集上的hazelcast条目监听器
- 24. 在hadoop集群上监控有节点的磁盘I/O
- 25. 在Weblogic群集上监视JMX,如何监视java.lang空间
- 26. 监控cassandra集群
- 27. Cassandra集群监控
- 28. 在开发人员或测试群集(单节点群集)上还原Cassandra快照(来自3节点群集)
- 29. 4节点Cassandra集群,每个集群都有50.00%
- 30. PM2群集模式与节点群集性能
我使用librato.com,它有一个非常简单的一体化进程读取指标,并显示在一个漂亮的仪表盘,也是一个Python模块用于发布或检索数据。 – Maviles