很多监控工具都可以与Kubernetes进行集成,而且越来越多的工具都在扩展其功能,以便更好地与Kubernetes集成。以下是一些流行的监控工具:
Prometheus
Prometheus是由SoundCloud开源的系统监控和告警套件。2012年以来,很多公司和组织都采用了Prometheus作为监控告警工具,而且Prometheus项目拥有一个非常活跃的开发者和用户社区。它现在是一个独立的开源项目,其维护不依赖于任何公司。为了强调这一点并明晰项目的治理架构,Prometheus于2016年加入了CNCF(Cloud Native Computing Foundation),这是继Kubernetes之后第二个在CNCF上托管的项目。
InfluxDB
InfluxDB是一个时序数据库,旨在应对高性能的写入和查询负载。它是TICK(Telegraf、InfluxDB、Chronograf和Kapacitor)栈中不可或缺的组成部分。InfluxDB专为存在大量时间戳数据的场景而设计,为其提供后端存储,包括DevOps监控、应用程序指标、IoT传感器数据和实时分析。
Datadog
Datadog为可扩展的云端应用提供监控服务,它通过基于SaaS的数据分析平台为服务器、数据库、工具和服务提供监控。
Sysdig
Sysdig Monitor是一款商业工具,它为云原生应用提供了Docker和Kubernetes的监控。Sysdig能够通过与Kubernetes的直接集成来采集、关联和查询Prometheus的指标数据。
云服务商工具
GCP Stackdriver
Stackdriver Kubernetes Engine Monitoring为监控GKE(Google Kubernetes Engine)集群而设计。它提供了监控与日志服务的统一管理,并提供一个专为GKE集群定制的仪表盘界面。Stackdriver Monitoring 提供了云端应用在性能、运行时间以及总体状态等方面的可见性。Stackdriver可以从Google Cloud Platform(GCP)、Amazon Web Services(AWS)、托管的运行时间探针、应用埋点等对象来收集指标、事件和元数据。
Microsoft Azure Monitor for containers
Azure Monitor for containers用于监控部署在Azure Container Instances或托管在Azure Kubernetes Service上的受管理的Kubernetes集群的容器化负载的性能。容器的监控至关重要,尤其是在运行了多个应用程序的大规模生产集群上。适用于容器的Azure Monitor会从Kubernetes中采集控制器、节点和容器的内存以及处理器指标,并通过Metrics API提供其性能的可见性。容器日志同样也会被收集,在Kubernetes集群监控启用后,容器的指标和日志会通过一个容器化的Linux Log Analytics代理自动收集。
AWS Container Insights
如果你正在使用ECS(Amazon Elastic Container Service)、EKS(Amazon Elastic Kubernetes Service),或者其他运行在Amazon EC2上的Kubernetes平台,可以使用CloudWatch Container Insights从容器化应用和微服务中收集、聚合以及汇总指标和日志。这些指标包括多种资源的利用率,例如CPU、内存、磁盘以及网络等。Container Insights还提供诊断信息,例如容器重启失败的信息,使你可以快速定位和解决问题。
在考虑采用哪种工具来实施指标监控时,指标数据的存储方式是一个重点考虑因素。如果采用的监控工具能够提供支持键值对存储的时序数据库,它将可以为你提供更丰富的指标属性。
持续评估你现有的监控工具,因为切换新的监控工具会存在学习曲线和实施运维成本。许多监控工具现在已经与Kubernetes进行了集成,所以请评估现有的工具是否已经满足需求。