k8s pod java 接口响应慢，超时 istio timeout

4、nginx 转发配置了 2个 istio ，但是总共有 11个 istio，整个集群有11个node。5、增加 nginx 转发的 istio 个数，增加到 4个，发现我方接口趋于正常，观察一夜再说。6、又过了几天，告警出现，悲催，看到jvm监控运行线程15，由此想到，数据源线程默认是15吧。4、增加pod tomcat 线程数，之前是默认值，250吧应该是，改成500，观察一夜。观察监

zhang_dianliang

1702人浏览 · 2021-11-05 18:15:21

zhang_dianliang · 2021-11-05 18:15:21 发布

描述：对接方请求我方接口，阶段性报 timeout conntion 链接异常

我方：阿里云 k8s 容器化部署

排查：

第一次因为istio节点数据不够，2021-11

1、查看nginx日志，发现 upstream timeout ，问运维 nginx 转发到了某一个 istio 上
2、随后在 nginx 所在服务器 telnet istio 所在ip，发现没有反应

3、看 istio 监控，发现流量较高，但不能确定是 istio 的压力大造成的

4、nginx 转发配置了 2个 istio ，但是总共有 11个 istio，整个集群有11个node
5、增加 nginx 转发的 istio 个数，增加到 4个，发现我方接口趋于正常，观察一夜再说

6、第二天，对方反应仍然有 2个 timeout，整体少了许多

7、扩展服务规格，由 4c16g 升到 8g32g，待观察是否还有问题

8、准备安装 istio 一套完整的监控，可以查看istio 的整体情况，到时候知道 istio 的峰值

9、扩充完 istio-ingressgateway ，我方接口响应时间恢复正常

第二次我方接口夜间高峰时段响应超过30s, 系统告警

1、查看pod cpu 内存正常，查看数据量近2个月增加了30%

2、增加 istio-ingressgateway 数量，增加一倍，观察一夜再说

3、情况没有改善，证明瓶颈不在 istio

4、增加pod tomcat 线程数，之前是默认值，250吧应该是，改成500，观察一夜

5、第二天无告警，笑的就像吃了蜜蜂屎，整个集群每秒并发最高 1万，525个pod

6、又过了几天，告警出现，悲催，看到jvm监控运行线程15，由此想到，数据源线程默认是15吧

7、增加最大线程数 Hikari-pool 50

8、
观察监控，静待佳音，优化之路，任重而道远，永无止境

待后续继续完善该文。。。

K8S/Kubernetes

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐

【深度】阿里巴巴万级规模 K8s 集群全局高可用体系之美

作者 | 韩堂、柘远、沉醉来源 | 阿里巴巴云原生公众号前言台湾作家林清玄在接受记者采访的时候，如此评价自己 30 多年写作生涯：“第一个十年我才华横溢，‘贼光闪现’，令周边黯然失色；第二个十年，我终于‘宝光现形’，不再去抢风头，反而与身边的美丽相得益彰；进入第三个十年，繁华落尽见真醇，我进入了‘醇光初现’的阶段，真正体味到了境界之美”。长夜有穷，真水无香。领略过了 K8s“身在江

K8S/Kubernetes

如何基于 K8s 构建下一代 DevOps 平台？

作者 | 孙健波（天元）导读：当前云原生 DevOps 体系现状如何？面临哪些挑战？如何通过 OAM 解决云原生 DevOps 场景下的诸多问题？云原生开发应用模型 OAM(Open Application Model) 社区核心成员孙健波将为大家一一解答，并分享如何基于 OAM 和 Kubernetes 打造无限能力的下一代 DevOps 平台。什么是 DevOps？为什么基于 Kub