logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Zabbix+Prometheus+云监控告警统一接入实战:用Webhook+事件总线搭建多源告警归一化平台

Zabbix管着网络设备和服务器、Prometheus管着容器和中间件、阿里云/腾讯云监控管着云上ECS——3套工具各发各的告警,值班人要同时盯3个渠道,重复告警没人去重,跨系统的关联故障没人能串起来。本文从一个真实的"3套监控并存"环境出发,完整实现多源告警统一接入:Zabbix Webhook配置、Prometheus Alertmanager对接、云API告警回调,统一写入事件总线做归一化处

文章图片
#zabbix#prometheus#kubernetes
教育行业IT运维的3个死结:选课系统年年崩、智慧教室天天报修、校园网晚高峰必卡

民办院校分校、连锁培训学校、职业教育机构的IT运维有三个结构性痛点:排课/考试系统开放瞬间全校涌入,2000人同时登录就能打崩一台4核8G的服务器;多媒体教室设备种类杂(投影、一体机、录播、扩音)且老师不会排障,一节课上不了就是教学事故;校园网白天要保教学直播、课间和晚上学生刷视频把带宽吃满。本文从一家管着4个教学点、800+终端设备、IT就2个人的连锁职业培训机构实际经历出发,拆解中小教育机构I

文章图片
#运维#网络#运维开发 +1
信创环境下的运维监控适配:鲲鹏+麒麟+达梦踩坑记录,附兼容性验证清单

等保过了,信创替换排上日程。但真正动手才发现:Zabbix Agent在鲲鹏ARM64上编译报错、Prometheus的node_exporter在麒麟V10上权限策略不兼容、达梦数据库的监控采集器找不到现成驱动……这篇把我们实际项目中遇到的信创适配问题按"OS层—数据库层—中间件层—网络设备层"逐层拆解,每层给出踩坑现象、排查路径和最终解决方案。附一份兼容性验证清单,标注了哪些开源工具能直接跑、

文章图片
#运维#网络#数据库 +1
信创环境下的运维监控适配:鲲鹏+麒麟+达梦踩坑记录,附兼容性验证清单

等保过了,信创替换排上日程。但真正动手才发现:Zabbix Agent在鲲鹏ARM64上编译报错、Prometheus的node_exporter在麒麟V10上权限策略不兼容、达梦数据库的监控采集器找不到现成驱动……这篇把我们实际项目中遇到的信创适配问题按"OS层—数据库层—中间件层—网络设备层"逐层拆解,每层给出踩坑现象、排查路径和最终解决方案。附一份兼容性验证清单,标注了哪些开源工具能直接跑、

文章图片
#运维#网络#数据库 +1
等保三级对运维监控有哪些要求?我把测评条款逐条拆成了落地配置

等保测评里跟运维监控相关的条款分散在"安全计算环境""安全管理中心""安全运维管理"三个大类里,合在一起有二十多条。但测评报告上写的都是标准语言,落到监控系统里到底该怎么配,大部分人看完还是不知道该做什么。这篇把等保三级里涉及运维监控的条款逐条拆解,每条给出对应的监控系统配置要求和验证方法。附一份自查清单,标注了哪些条款用开源工具就能满足、哪些需要商业平台、哪些需要额外补建。

文章图片
#运维#网络
100+门店运维平台要具备哪些能力?从踩坑到选型,我整理了一份能力清单

多门店 IT 运维从几十家扩张到一百家以上,靠 Excel 和微信群就会彻底失控。本文整理了平台选型的 8 项核心能力:统一资产台账、按组织结构分层监控、告警降噪与事件化、统一工单与 SLA 闭环、现场工程师管理、拓扑与全链路可视、报表辅助决策、AI 加持。这 8 项能力构成一条完整链路,任何一环断掉后面就会出问题。文末附可操作自检表,对照现状逐项确认,空白最多的地方就是最先要补的。

文章图片
#运维#人工智能
100+门店运维平台要具备哪些能力?从踩坑到选型,我整理了一份能力清单

多门店 IT 运维从几十家扩张到一百家以上,靠 Excel 和微信群就会彻底失控。本文整理了平台选型的 8 项核心能力:统一资产台账、按组织结构分层监控、告警降噪与事件化、统一工单与 SLA 闭环、现场工程师管理、拓扑与全链路可视、报表辅助决策、AI 加持。这 8 项能力构成一条完整链路,任何一环断掉后面就会出问题。文末附可操作自检表,对照现状逐项确认,空白最多的地方就是最先要补的。

文章图片
#运维#人工智能
ITSM 实战:多门店报障如何做统一受理、派单和 SLA 升级,避免群里越报越乱

多门店 IT 运维场景中,很多团队仍然依赖微信群报障,随着门店数量增加,容易出现信息被刷、重复报障、责任不清以及 SLA 无法统计等问题。本文结合实际运维经验,介绍一套适用于连锁门店的 ITSM 最小管理模型,通过统一报障入口、标准化派单流程以及 SLA 分级与升级机制,实现多门店故障的统一受理、快速派单和可追踪处理。同时提供报障登记、派单记录、SLA 管理及运维流程自查等实用模板,帮助运维团队在

文章图片
#运维#网络
到底了