最受欢迎的Java web应用服务器之一——Tomcat监控选型及实践

监控选型 Tomcat Manager和Psi-probe是不错的可视化监控工具，能够很好地查看Tomcat状态信息（比如单位时间请求数，线程状态等）。在生产环境中，随着Tomcat实例的不断增加，维护不同实例上的Manager控制台会显得有些繁琐，同时，为了与企业监控系统、运维仪表盘等结合，有必要选择兼容性和适配性更好的监控工具。如今，企业微服务的流行和CI/CD的强需求性，要...

焦振清

15835人浏览 · 2019-01-07 15:41:42

焦振清 · 2019-01-07 15:41:42 发布

监控选型

Tomcat Manager和Psi-probe是不错的可视化监控工具，能够很好地查看Tomcat状态信息（比如单位时间请求数，线程状态等）。在生产环境中，随着Tomcat实例的不断增加，维护不同实例上的Manager控制台会显得有些繁琐，同时，为了与企业监控系统、运维仪表盘等结合，有必要选择兼容性和适配性更好的监控工具。

如今，企业微服务的流行和CI/CD的强需求性，要求我们的服务在易于开发和维护的同时，具有伸缩性强、快速交付等特点。在此环境下，Tomcat+Prometheus+Grafana能够很好的与企业已有架构适配，并能够很好的与其他中间件服务监控整合到一起。Prometheus作为新一代的云原生监控系统，鼓励用户监控服务的内部状态，让用户可以获取服务和应用内部真正的运行状态。

容器环境下Tomcat+Prometheus+Grafana简图如下：

在实际部署中，可以简单分为如下几个步骤：

1、下载jmx_prometheus_javaagent (https://github.com/prometheus/jmx_exporter)，若为容器环境，可将jmx_prometheus_javaagent与Tomcat一起打进运行镜像。

2、Tomcat启动时，JAVA_OPTS增加Javaagent和Tomcat config.yaml (https://github.com/prometheus/jmx_exporter/blob/master/example_configs/Tomcat.yml )配置，例如：JAVA_OPTS=”-javaagent:/var/tomcat/jmx_prometheus_javaagent-0.3.1.jar=port:/vat/tomcat/conf/config.xml”（port为实际端口）。

3、Prometheus添加Tomcat的job_name。

监控指标梳理

在《SRE: Google运维解密》一书中指出，监控系统需要能够有效的支持白盒监控和黑盒监控。通过白盒监控能够了解其内部的实际运行状态，通过对监控指标的观察能够预判可能出现的问题，从而对潜在的不确定因素进行优化。而黑盒监控，常见的如HTTP探针，TCP探针等，可以在系统或者服务在发生故障时能够快速通知相关的人员进行处理。

监控的四个黄金指标可以在服务级别帮助我们更好地衡量终端用户体验、服务中断、业务影响等层面的问题。主要关注以下四种类型的指标：错误，延迟，流量以及饱和度。

通过对黑盒、白盒监控的理解，结合监控的四个黄金指标，针对Tomcat的重要监控指标，可以从以下几个方面进行考虑：

监控分类	重要监控指标	指标说明
错误	Tomcat requestcount and errorcount	Tomcat实例总请求数和错误请求数
延迟	Tomcat response time	Tomcat实例的Response time
流量	Tomcat bytessent and bytesreceived	Tomcat实例发送和接受的流量
饱和度	heap memory	堆内存的使用情况
	jvm gc	GC次数和耗时
	jvm_threads	线程数