pod中state与laststate及kubectl get pod中的status的关联

描述在pod拉起容器失败时，查看pod的json信息中state与lastState关联，以及其与kubectl get pod中STATUS字段的关联。

fibo_nacci

5522人浏览 · 2017-09-10 17:07:10

fibo_nacci · 2017-09-10 17:07:10 发布

如果pod拉起容器失败，在pod的json中containerStatuses中可以看到有个lastState的field，如果容器运行正常且之前没有异常退出，这个field是个空值。这里探讨一下pod json中state，lastState及kubectl get po看到pod的status之间的关联。

首先明确containerStatus中的LastTerminationState，这个值即pod json中的lastState的值

如果容器退出了，状态保留在LastTerminationState，state.waiting里值是reason值，这个reason从reasoncache里取出来的。（pod里的container第一次启动后失败，lastState是空值）

研究一下kubelet的这个reasonCache，发现其只在一个地方做了更新，这个update能add能remove。这里看到只有SyncPod的返回值进入到了这个reasoncCache

其中的Update只对StartContainer类型的action才会存储，如下：

这个SyncPod在docker_manager.go中实现，其中将失败原因写到result中，result类别比较多，既包含pause容器的，也包含用户容器的，并且有多种SyncAction的，如下，其中我们只关注startcontainer，原因上面说了，reasonCache里只会存储startcontainer这个action相关的key。

对于启动用户容器，处于backoff阶段的pod拿到的错误原因是crashloopbackoff，不处于backoff阶段的才拿到的真正失败原因（调用栈tryContainerStart -> runContainerInPod -> runContainer -> StartContainer -> docker api）。注意这个result对应的key是startcontainer

去doBackOff里看，拿到的错误即是crashloopbackoff，这就是我们大部分时候看失败的pod，其状态是CrashLoopBackOff。

我们都是通过kubectl看pod的状态，接下来论证kubectl看到的状态就是从pod json中的state字段拿的，

即证明上图中的STATUS中的值为下图中的state.waiting.reason

在pkg/kubectl/resource_printer.go中有如下代码：

在Backoff阶段，把container.State.Waiting.Reason赋给了reason，在随后的输出中，看到reason在第4列，

对应kubectl的输出，

即得证kubectl看到的失败的pod状态就是从pod json中的state字段拿的。至于后面多出来的IP和NODE两列，是因为kubectl加了-o wide

结论：lastState里的reason是上次容器退出的原因，state里的reason如果处于backoff时期，就是CrashLoopBackOff，否则显示是当前容器退出的原因。kubectl get pod 看到的STATUS值即state里的reason值。

向您推荐>>Eolink开发者社区

权威｜前沿｜技术｜干货｜国内首个API全生命周期开发者社区

更多推荐

深入理解 Mocha 测试框架：从零实现一个 Mocha

前言什么是自动化测试自动化测试在很多团队中都是Devops环节中很难执行起来的一个环节，主要原因在于测试代码的编写工作很难抽象，99%的场景都需要和业务强绑定，而且写测试代码的编写工作量往往比编写实际业务代码的工作量更多。在一些很多业务场景中投入产出比很低，适合写自动化测试的应该是那些中长期业务以及一些诸如组件一样的基础库。自动化测试是个比较大的概念，其中分类也比较多，比如单元测试，端对端测试，集

云原生

ELK实现containerd的容器日志采集展示【基于logging的全栈监测】

企业级ELK Stack构建介绍

云原生

(20200916 Solved)docker-compose up创建容器自动退出

问题描述如题，创建容器后自动退出了。并且docker start container无效解决方案原因是缺失了控制终端的配置，需要在docker-compose.yml中增加tty:true ，有时候这样也不行，需要再增加一个command:/bin/bash，命令不一定是这个，需要是一个不会退出的命令，然后用-d后台启动容器。Referencesdocker-compose启动容器后自动退出...

云原生

所有评论(0)

查看更多评论

fibo_nacci

@flyupliu

已为社区贡献1条内容