k8s重启Exit Code: 137;Reason: OOMKilled
发现原因:红框里的信息OOMKilled,退出的提示码是137,经过查询发现是部署服务时的yaml文件里的限制内存写的有点小,简单来说就是:你运行项目需要的内存比你设置的内存大,在你运行项目的时候申请内存超过了你限制的内存就会报错退出,然后重启。一开始以为是程序中下载的训练模型太大了,每天都下载一遍模型并且不会删除,导致内存溢出服务挂掉然后重启。在自己文件中把这个改大了一些,观察了一段时间,暂时还
·
问题:发现部署到k8s上的服务一直在自动重启。
一开始以为是程序中下载的训练模型太大了,每天都下载一遍模型并且不会删除,导致内存溢出服务挂掉然后重启。后来修改了模型下载逻辑,观察之后还是会不停重启。
网上看到有人说可能是服务部署设置的问题,使用命令
kubectl describe pod podname(写想查看的pod的name)
可以看到服务的详细信息
发现原因:红框里的信息OOMKilled,退出的提示码是137,经过查询发现是部署服务时的yaml文件里的限制内存写的有点小,简单来说就是:你运行项目需要的内存比你设置的内存大,在你运行项目的时候申请内存超过了你限制的内存就会报错退出,然后重启。
在自己文件中把这个改大了一些,观察了一段时间,暂时还没有遇到重启。
更多推荐
已为社区贡献1条内容
所有评论(0)