



这个问题的简单回答是:所有指标。但过多的监控指标会造成干扰,会让你忽视真正需要洞悉的信号。在考虑Kubernetes中的监控时,我们要采取分层的方法,考虑如下因素:
●物理或虚拟节点。
●集群组件。
●集群附加组件。
●终端用户应用程序。
使用这种分层的监控方法,你可以更轻松地在监控系统中识别正确的信号。它让你能够更有针对性地处理问题。例如,如果有Pod被挂起,你可以从节点的资源使用情况开始排查,如果一切正常,再进一步排查集群组件。
以下是你需要在系统中监控的指标:
●节点
—CPU使用率
—内存使用率
—网络使用率
—磁盘使用率
●集群组件
—etcd延迟
●集群附加组件
—Cluster Autoscaler
—Ingress Controller
●应用
—容器内存使用率及饱和度
—容器CPU使用率
—容器网络使用率和错误率
—应用程序框架的特定指标