2016-11-22 29 views
5

我们在AWS中运行Kubernetes集群,并使用dd-agent DaemonSet收集DataDog中的度量标准。为什么我的DataDog实例报告Kubernetes“no_pod”?

我们有一个Pod显示在我们的度量标记为“no_pod”的指标中,并且它使用了大量资源,内存/ CPU/NetworkTx/NetworkRX。

有什么解释,这个吊舱是什么,我怎么能找到它,杀死它,重新启动它等?

我发现dd-agent source code似乎定义了“no_pod”标签,但我无法理解它为什么存在,它来自哪里以及如何通过kubectl等找到它。

enter image description here

+0

通常“no_pod”指的是在kubernetes之外启动的容器,但看起来像是大量的“no_pod”容器。你有可能向我们发送一张flare与你的日志和配置,所以我们可以帮助挖掘? https://help.datadoghq.com/hc/en-us/articles/204991415-Send-logs-and-configs-to-Datadog-via-flare-command –

+0

嗨@IlanRabinovitch。感谢您的回复。我会发一个闪光。 – jonhoare

回答

3

说话的支持团队DataDog后,我设法找到了有关什么no_pod豆荚以下信息。

我们Kubernetes检查越来越从Kubernetes API,它公开汇总数据容器的列表。在这里的公制浏览器配置中,您可以看到一些名为/ docker和/的容器以及其他容器。来自container_name:/和container_name:/ docker的pod_name:no_pod度量标准只是聚合在多个容器中的度量标准。 (因此它们是图表中最高的值是合理的。)如果您不希望图表显示这些聚集的容器指标,则可以克隆仪表板,然后从查询中排除这些容器。为此,在克隆的仪表板上,只需在JSON选项卡中编辑查询,然后在标记范围中添加!pod_name:no_pod。

所以看来这些豆荚是运行在集群外的码头工人和根级容器将始终显示,除非你想给他们明确我现在做的过滤掉。

非常感谢DataDog的支持人员,他们为我调查了这个问题,并给出了关于pod的一个很好的解释,并基本证实我可以安全地过滤掉这些问题,而不用担心它们。

相关问题