1. docker进程僵死无法启动服务

#查看docker状态异常
#使用systemctl (start、restart、stop) docker 均会卡死
#查看/run/containerd没有配置信息

#查看该服务进程
ps -ef | grep docker 

#手动进行杀死恢复
kill -s 9 pid

 

2. docker内存泄漏

#报错信息
Warning  FailedCreatePodSandBox  12m (x231 over 7h38m)    kubelet, 192.168.1.20  (combined from similar events): Failed create pod sandbox:
 rpc error: code = Unknown desc = failed to start sandbox container for pod "centralized-paas-admin-mysql01-slave-7hs5l": 
Error response from daemon: OCI runtime create failed: container_linux.go:345:
 starting container process caused "process_linux.go:281: applying cgroup configuration for process caused \"mkdir /sys/fs/cgroup/memory/kubepods/besteffort/pod76759db8-fa79-4f9c-b975-7875d77bc4fb
/f8377babc2a32f0383c7e04dc0ca122a11bea2ab6a87325a46fa6d30b815a45f: cannot allocate memory\"": unknown
 
 
#关键字
/sys/fs/cgroup/memory/kubepods/besteffort/
 
#状况,显示为create状态或pending状态
登陆主机发现主机容器全部挂掉了

症状

#查看容器数量越来越多
[ecip@cmpaas~]$ sudo docker ps -a | wc -l
170
[ecip@cmpaas ~]$ sudo docker ps -a | wc -l
260
[ecip@cmpaas ~]$ sudo docker ps -a | wc -l
284
[ecip@cmpaas ~]$ sudo docker ps -a | wc -l
296
[ecip@cmpaas ~]$ sudo docker ps -a | wc -l
314
 
 
 
#解决方法,重启主机

3.docker二进制文件不匹配

docker: Error response from daemon: no status provided on response: unknown.


可能是二进制执行文件和服务文件不匹配导致的

我之前yum安装的docker,估计拷贝的时候忘了,用的之前环境的导致容器一致起不来

4. docker升级失败

隐约记得是19版本下的01升级到14

升级失败后无法启动,还原后也无法正常运行
将数据目录干掉也不能用

错误原因containerd数据未清理

需要删除
1, docker数据目录
2, container  好像是/run/containerd目录 和/var/run/containerd目录

需要先停止docker服务

 

Logo

开源、云原生的融合云平台

更多推荐