Zabbix自带模板检测的CPU load之坑
Zabbix2.0后,自带的Template OS Linux模版中 Processor load检测的值为percpu,即每一个CPU的load,如果为多核CPU的话,这里获取到的值就不是全部CPU的,自然与在系统中执行uptime命令获取到的load值不符, 并且模版中自带触发器的报警阈值也相当高,没记错的话应该是4还是5,这就造成一个情况,明明机器的CPU负载很高,Zabbix确不报警,此是
·
Zabbix2.0后,自带的Template OS Linux模版中 Processor load检测的值为percpu,即每一个CPU的load,如果为多核CPU的话,这里获取到的值就不是全部CPU的,自然与在系统中执行uptime命令获取到的load值不符, 并且模版中自带触发器的报警阈值也相当高,没记错的话应该是4还是5,这就造成一个情况,明明机器的CPU负载很高,Zabbix确不报警,此是大坑之一..解决办法有两个(使用其中一个即可):
- 将Processor load的键值修改为检测所有CPU,将其中的percpu修改为all即可,注意默认模版有三个监控项
Processor load (1 min average per core)
Processor load (5 min average per core)
Processor load (15 min average per core)
- 降低触发器的报警阈值,默认模版只带了一个触发器,修改触发器表达式为(我这里改成了1.5,即单个CPU的load超过1.5即报警):
{Template OS Linux:system.cpu.load[percpu,avg1].avg(5m)}>1.5
转载于:https://blog.51cto.com/kusorz/2321877
更多推荐
已为社区贡献287条内容
所有评论(0)