logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

k8s重启Exit Code: 137;Reason: OOMKilled

发现原因:红框里的信息OOMKilled,退出的提示码是137,经过查询发现是部署服务时的yaml文件里的限制内存写的有点小,简单来说就是:你运行项目需要的内存比你设置的内存大,在你运行项目的时候申请内存超过了你限制的内存就会报错退出,然后重启。一开始以为是程序中下载的训练模型太大了,每天都下载一遍模型并且不会删除,导致内存溢出服务挂掉然后重启。在自己文件中把这个改大了一些,观察了一段时间,暂时还

文章图片
#linux#docker#运维
Ubuntu自动升级linux内核导致nvidia/cuda驱动报错

linux系统自动升级内核导致nvidia驱动版本不匹配报错,docker运行容器使用gpu

文章图片
#ubuntu#linux#python +2
到底了