项目场景:
服务器异常断电后在k8s 集群get nodes出现
E0408 15:31:50.400954 23612 memcache.go:265] couldn't get current server API group list: Get "https://192.168.0.20:6443/api?timeout=32s": dial tcp 192.168.0.20:6443: connect: connection refused
问题描述
查看kubelet服务状态
systemctl status kubelet.service
发现服务处于loaded状态,kubelet.service entered failed state.
查看kubelet日志
journalctl -u kubelet -f
Apr 08 16:57:15 master kubelet[27951]: E0408 16:57:15.786948 27951 run.go:74] "command failed" err="failed to parse kubelet flag: unknown flag: --network-plugin"
原因分析:
根据日志可以初步判断,应该是cni网络模块除了问题,kebelet重启后,启动网络插件的命令无法执行。
之后分别在master和node节点上查看下kubelet的版本,结果发现了问题:
rpm -qa | grep kube
即master节点的kubeadm、kubelet、kubernetes-cni、kubectl和node节点的版本不一致,且master节点使用的版本的高于node节点。
解决方案:
问题解决
即尝试,将master节点的kubeadm、kubelet、kubernetes-cni、kubectl版本降级至与node节点一致。
yum downgrade kubeadm-1.18.0-0.x86_64 kubectl-1.18.0-0.x86_64 kubelet-1.18.0-0.x86_64
重启kubelet
sudo systemctl restart kubelet.service
systemctl daemon-reload
查看kubelet的状态,kubelet服务 active (running)
查看kubelet日志,正常
get nodes、get pod均正常
原文地址:https://blog.csdn.net/qq_45547688/article/details/131325877
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。