Spring Cloud健康检查的陷阱
健康检查 基于Spring Boot Actuator的健康检查是Spring Cloud微服务的必备组件,用来确保我们的服务是否可用。 引入 Spring Boot Actuator后,通过http://ip:port/health ,可以看到 HealthEndPoint 给我们提供默认的监控结果,包含磁盘检测和数据库检测。如下{"status": "UP&qu
·
健康检查
基于Spring Boot Actuator的健康检查是Spring Cloud微服务的必备组件,用来确保我们的服务是否可用。 引入 Spring Boot Actuator后,通过http://ip:port/health ,可以看到 HealthEndPoint 给我们提供默认的监控结果,包含磁盘检测和数据库检测。如下
{
"status": "UP",
"diskSpace": {
"status": "UP",
"total": 398458875904,
"free": 315106918400,
"threshold": 10485760
},
"db": {
"status": "UP",
"database": "MySQL",
"hello": 1
}
}
排除不必要的健康检查项
有一天调用方突然反馈调不通我们的服务。查看Eureka控制台,发现服务状态是UP。查看服务进程一切正常。束手无策之际,忽然想到会不会是健康检查在作怪,因为Eureka Client判断服务可用与否的依据就是健康检查。而Spring Boot Actuator所有的监控项中的任何一个健康状态是DOWN,那个整体应用的健康状态也是DOWN,这时候调用方就把服务当作不可用。
再次查看http://ip:port/health,果然发现有一项邮件健康检查挂了。最近项目引入了spring-boot-starter-mail,实现发送邮件的功能。邮箱服务器挂了,造成整个服务的监控检查状态是DOWN。
{
"status": "DOWN",
"mail": {
"status": "DOWN",
"location": "email-smtp.test.com:-1",
"error": "javax.mail.AuthenticationFailedException: 535 Authentication Credentials Invalid\n"
},
"diskSpace": {
"status": "UP",
"total": 266299998208,
"free": 146394308608,
"threshold": 10485760
},
"hystrix": {
"status": "UP"
}
}
由于邮件发送不是核心功能,可以把非核心组件从健康检查中排除,避免造成整个服务不可用。通过如下配置关闭邮箱健康检查。
management.health.mail.enabled=false
更多推荐
已为社区贡献1条内容
所有评论(0)