Service 无法解析

集群 DNS 没有正常运行(kube-dns或CoreDNS)

检查集群 DNS 是否运行正常:

  • kubelet 启动参数 --cluster-dns 可以看到 dns 服务的 cluster ip:
  1. $ ps -ef | grep kubelet
  2. ... /usr/bin/kubelet --cluster-dns=172.16.14.217 ...
  • 找到 dns 的 service:
  1. $ kubectl get svc -n kube-system | grep 172.16.14.217
  2. kube-dns ClusterIP 172.16.14.217 <none> 53/TCP,53/UDP 47d
  • 看是否存在 endpoint:
  1. $ kubectl -n kube-system describe svc kube-dns | grep -i endpoints
  2. Endpoints: 172.16.0.156:53,172.16.0.167:53
  3. Endpoints: 172.16.0.156:53,172.16.0.167:53
  • 检查 endpoint 的 对应 pod 是否正常:
  1. $ kubectl -n kube-system get pod -o wide | grep 172.16.0.156
  2. kube-dns-898dbbfc6-hvwlr 3/3 Running 0 8d 172.16.0.156 10.0.0.3

Pod 与 DNS 服务之间网络不通

检查下 pod 是否连不上 dns 服务,可以在 pod 里 telnet 一下 dns 的 53 端口:

  1. # 连 dns service 的 cluster ip
  2. $ telnet 172.16.14.217 53

如果检查到是网络不通,就需要排查下网络设置:

  • 检查节点的安全组设置,需要放开集群的容器网段
  • 检查是否还有防火墙规则,检查 iptables