admin 管理员组文章数量: 1184232
1. 彻底清理 Kubernetes 残留痕迹
原因
:
残留的配置文件、静态 Pod 清单和网络配置会导致初始化冲突。
kubeadm reset
可能未完全清理环境。
操作 :
# 重置 kubeadm 并强制清理 sudo kubeadm reset -f # 手动删除所有残留文件 sudo rm -rf \ /etc/kubernetes \ /var/lib/etcd \ /var/lib/kubelet \ /etc/cni/net.d \ /etc/systemd/system/kubelet.service.d \ $HOME/.kube # 强制删除可能残留的静态 Pod 清单(关键!) sudo find /etc/kubernetes/manifests -type f -name '*.yaml' -delete
2. 解除端口 10250 占用
原因
:
端口被占用通常由未完全退出的 kubelet 或残留容器引起。
操作 :
# 查找并终止占用 10250 端口的进程 sudo ss -tulnp | grep 10250 sudo kill -9 <PID> # 根据输出结果替换 <PID> # 确保 kubelet 完全停止 sudo systemctl stop kubelet # 清理容器运行时残留 sudo crictl rm -f $(sudo crictl ps -aq) 2>/dev/null
3. 修复 kubelet 服务配置
原因
:
cgroup 驱动不一致或证书错误会导致 kubelet 无法启动。
操作 :
# 检查 kubelet 配置 sudo grep cgroupDriver /var/lib/kubelet/config.yaml # 如果输出不是 `systemd`,修复配置 sudo sed -i 's/cgroupDriver: cgroupfs/cgroupDriver: systemd/' /var/lib/kubelet/config.yaml # 重启服务 sudo systemctl daemon-reload sudo systemctl restart kubelet
4. 验证容器运行时 (containerd) 配置
原因
:
containerd 的 cgroup 驱动或镜像仓库配置错误会导致控制平面组件无法启动。
操作 :
# 确认 containerd 使用 systemd cgroup 驱动 sudo grep SystemdCgroup /etc/containerd/config.toml # 输出应为:SystemdCgroup = true # 如果未配置,修复后重启 sudo sed -i 's/SystemdCgroup = false/SystemdCgroup = true/' /etc/containerd/config.toml sudo systemctl restart containerd # 手动拉取镜像测试 sudo crictl pull registry.aliyuncs.com/google_containers/kube-apiserver:v1.27.16
5. 使用强制模式重新初始化集群
原因
:
标准初始化流程可能被残留配置干扰,需强制覆盖。
操作 :
# 初始化命令(添加 --ignore-preflight-errors 跳过残留文件检查)
sudo kubeadm init \
--config kubeadm-config.yaml \
--upload-certs \
--ignore-preflight-errors=FileAvailable--etc-kubernetes-manifests-*
# 如果仍报端口占用,强制释放
sudo lsof -i :10250 | awk 'NR!=1 {print $2}' | xargs sudo kill -96. 关键配置验证
| 检查项 | 命令 | 预期结果 |
|---|---|---|
| kubelet 服务状态 |
systemctl status kubelet
|
Active: active (running)
|
| 控制平面容器状态 |
crictl ps | grep 'kube-apiserver'
|
所有组件处于
Running
状态
|
| 端口占用情况 |
ss -tulnp | grep 10250
| 无输出 |
| 镜像完整性 |
crictl images | grep 'google_containers'
| 显示所有 v1.27.16 版本镜像 |
后续步骤
部署网络插件 (如 Calico):
kubectl apply -f
恢复环境 :
mkdir -p $HOME/.kube sudo cp /etc/kubernetes/admin.conf $HOME/.kube/config sudo chown $(id -u):$(id -g) $HOME/.kube/config
若仍失败:深度排查
查看 kubelet 详细日志:
journalctl -xeu kubelet --no-pager | grep -i -E "error|fail|crash"
检查控制平面组件日志:
crictl ps -a | grep -E "kube-apiserver|etcd" crictl logs <CONTAINER_ID>
使用调试模式初始化:
kubeadm init --v=5 # 输出级别调至最高
版权声明:本文标题:kubernetes初始化失败_kubernetes 1.28.2部署初始化失败 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/b/1774009023a3568264.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论