Metrics

从 v1.8 开始,资源使用情况的度量(如容器的 CPU 和内存使用)可以通过 Metrics API 获取。注意

  • Metrics API 只可以查询当前的度量数据,并不保存历史数据
  • Metrics API URI 为 /apis/metrics.k8s.io/,在 k8s.io/metrics 维护
  • 必须部署 metrics-server 才能使用该 API,metrics-server 通过调用 Kubelet Summary API 获取数据

开启API Aggregation

在部署 metrics-server 之前,需要在 kube-apiserver 中开启 API Aggregation,即增加以下配置

  1. --requestheader-client-ca-file=<path to aggregator CA cert>
  2. --requestheader-allowed-names=aggregator
  3. --requestheader-extra-headers-prefix=X-Remote-Extra-
  4. --requestheader-group-headers=X-Remote-Group
  5. --requestheader-username-headers=X-Remote-User
  6. --proxy-client-cert-file=<path to aggregator proxy cert>
  7. --proxy-client-key-file=<path to aggregator proxy key>

如果kube-proxy没有在Master上面运行,还需要配置

  1. --enable-aggregator-routing=true

部署 metrics-server

  1. $ git clone https://github.com/kubernetes-incubator/metrics-server
  2. $ cd metrics-server
  3. $ kubectl create -f deploy/1.8+/

稍后就可以看到 metrics-server 运行起来:

  1. kubectl -n kube-system get pods -l k8s-app=metrics-server

Metrics API

可以通过 kubectl proxy 来访问 Metrics API

  • http://127.0.0.1:8001/apis/metrics.k8s.io/v1beta1/nodes
  • http://127.0.0.1:8001/apis/metrics.k8s.io/v1beta1/nodes/<node-name>
  • http://127.0.0.1:8001/apis/metrics.k8s.io/v1beta1/pods
  • http://127.0.0.1:8001/apis/metrics.k8s.io/v1beta1/namespace/<namespace-name>/pods/<pod-name>

也可以直接通过 kubectl 命令来访问这些 API,比如

  • kubectl get --raw apis/metrics.k8s.io/v1beta1/nodes
  • kubectl get --raw apis/metrics.k8s.io/v1beta1/pods
  • kubectl get --raw apis/metrics.k8s.io/v1beta1/nodes/<node-name>
  • kubectl get --raw apis/metrics.k8s.io/v1beta1/namespace/<namespace-name>/pods/<pod-name>

排错

如果发现 metrics-server Pod 无法正常启动,比如处于 CrashLoopBackOff 状态,并且 restartCount 在不停增加,则很有可能是其跟 kube-apiserver 通信有问题。查看该 Pod 的日志,可以发现

  1. dial tcp 10.96.0.1:443: i/o timeout

解决方法是:

  1. echo "ExecStartPost=/sbin/iptables -P FORWARD ACCEPT" >> /etc/systemd/system/docker.service.d/exec_start.conf
  2. systemctl daemon-reload
  3. systemctl restart docker

参考文档