老年代内存不足报警

部分DNS解析在高并发下有性能瓶颈，确保系统的DNS是可靠的，比如，k8s dns解析策略，确保是高性能的，避免无效的查询。另外，部分域名可能会启用 DNS 负载均衡，即每次解析返回的多个IP地址的顺序不同，过大的ttl会影响负载均衡效果。除了应用层的缓存外，也可尝试 JVM自身的DNS缓存 (这个是全局的)，通过命令行来控制缓存过期时间， see。DNS解析失败未必会产生负面影响，比如，可能当时

码海拾贝2023

614人浏览 · 2023-03-23 20:31:08

码海拾贝2023 · 2023-03-23 20:31:08 发布

背景知识 (background)

老年代的对象大多是经过多轮Young GC后晋升上来的，即对象在堆里存活的时间比较长。

老年代内存不足通常意味着内存泄露，伴随着频繁的FullGC，可能会有较大停顿，甚至停顿十几秒，导致健康检查失败或接口超时。

目前老年代内存占用超过80%且持续2分钟，则会触发报警。

查看指标 (dashboard)

在这里插入图片描述

其中，Old Gen(heap)即老年代内存占用，min 即所选时段最小值，max 为所选时段最大占用，current为当前内存。

另外，开发也应关注监控面板：GC耗时和 GC原因与频次。

止损措施 (action)

若想保存案发现场，可临时摘流后dump内存。

若想快速恢复，去私有云/容器平台手动重启报警节点，一般重启会平滑摘流、优雅停机。

事后改进(postmortem)

老年代内存不足，大多是内存泄露，建议摘流后Dump堆内存，联系OP下载到本地MAT内存分析，及时修复。

我们整理了一些常见的原因(cause)，仅供参考。

可能的原因 (cause)

内存泄露的原因很多，大多是对象的生命周期太久了。

一、对象被长生命周期的组件引用

常见的全局静态变量、单例对象等强引用临时变量。

比如，Map每次调用Put添加对象，但缺乏淘汰机制；本地缓存没有限制最大缓存数量；ThreadLocal没有正确的清理数据；一次性加载过多数据到内存里；

在性能统计等场景使用Map时，一定要确保在任意编码习惯下的 Key / Value内存开销是可控的，比如，Druid 数据源的SQL统计，我们之前遇到过有的项目SQL语句几百KB，导致SQL统计占用过多内存。

有的项目使用OpenFeign + PathVariable/RequestParam 请求Restful接口，但指标生成时，取了动态生成的uri导致指标数量膨胀。

有的项目使用MyBatis的foreach，传递了过多的参数，导致MyBatis生成的临时大对象存在过久，不能被及时回收。

有的组件使用JVM Runtime#addShutdownHook注册钩子销毁资源，那这个对象会一直被JVM Hook引用，若创建了很多实例，则都不会被回收。

二、内存分配速率过大

可参考监控面板：GC内存分配，了解每秒钟新生代分配了多少内存、多少内存晋升到了老年代。

内存分配过大，可能是一次性加载的数据过多，通常伴随着慢请求、慢查询、不合理的报表导入导出或文件上传下载机制。

对G1来说，大对象(Humongous)会直接在老年代分配，其他GC算法也有类似机制，超过一定阈值直接晋升到老年代。

如果业务逻辑执行过久，则会导致对象不能被及时回收。

建议通过应用大盘的常用排行榜 ( HTTP慢接口/慢SQL排行 ) 或查看当时的Accesslog、应用日志来筛选可能的请求，尽可能优化代码实现，降低单次执行的资源消耗。

另外，可尝试 hawk的HeartBeat 、arthas 查看当时的线程堆栈，找到可能的慢请求。

K8S/Kubernetes

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐

【深度】阿里巴巴万级规模 K8s 集群全局高可用体系之美

作者 | 韩堂、柘远、沉醉来源 | 阿里巴巴云原生公众号前言台湾作家林清玄在接受记者采访的时候，如此评价自己 30 多年写作生涯：“第一个十年我才华横溢，‘贼光闪现’，令周边黯然失色；第二个十年，我终于‘宝光现形’，不再去抢风头，反而与身边的美丽相得益彰；进入第三个十年，繁华落尽见真醇，我进入了‘醇光初现’的阶段，真正体味到了境界之美”。长夜有穷，真水无香。领略过了 K8s“身在江

K8S/Kubernetes

如何基于 K8s 构建下一代 DevOps 平台？

作者 | 孙健波（天元）导读：当前云原生 DevOps 体系现状如何？面临哪些挑战？如何通过 OAM 解决云原生 DevOps 场景下的诸多问题？云原生开发应用模型 OAM(Open Application Model) 社区核心成员孙健波将为大家一一解答，并分享如何基于 OAM 和 Kubernetes 打造无限能力的下一代 DevOps 平台。什么是 DevOps？为什么基于 Kub