云原生环境中的监控与传统应用程序的监控类似,均包含跟踪指标、日志和事件,而二者的主要区别在于云原生环境中的某些托管对象具有临时性和非持久性。监控可以让运维人员洞察系统当前运行的状况、监测问题并进行及时修复。此外,监控还能跟踪应用程序运行状况、用户行为等。因此,监控是有效运行应用程序的重要组成部分。

监控工具分析对比

Prometheus

Prometheus 是由 SoundCloud 开源的监控告警解决方案,由golang编写,是 CNCF 中 Docker 和 Kubernetes 御用的监控工具。

优劣势分析

优势:查询方式灵活且效率高、支持大规模集群监控模式、扩展性强、便于维护。

劣势:需要脚本开发能力,学习成本较高。

使用场景分析

  • 适用于云计算、容器化场景。

Grafana

Grafana是一个系统监控看板,支持许多不同的数据源。作为跨平台开源的度量分析与可视化套件,Grafana是一个仅由 Javascript 开发的前端工具,通过访问库(如InfluxDB)展示自定义报表、显示图表等。

优劣势分析

优点:界面简介友好、插件丰富、拥有强大的功能且支持自由定制。

缺点:需要用户具备一定数据开发能力,故存在学习成本。

使用场景分析

  • 用于Prometheus等监控工具的数据可视化实现。

Thanos

Thanos定义:是一组组件,可以组成具有长期存储功能的高可用性Prometheus设置。 其主要目标是简化操作,保留Prometheus的可靠性。

优劣势分析

优势:高可用性、高空间利用率、跨集群查询、横向拓展、查询去重、统一查询入口。

使用场景分析

适用于云原生场景大型分布式监控。

监控直播课程预约

直播简介

直播 主题 云原生时代热门监控利器的解析应用

直播 时间 3月31日(周四)19:00-20:00

讲师简介: 云智慧运维开发工程师-李晨阳

直播亮点:

  1. 深度解析监控目的与监控维度,了解4个监控黄金指标;
  2. 详细解构 Prometheus 架构设计,了解 Prometheus 的指标类型与高可用实践;
  3. 高效实践 Grafana & Thanos,在线学习应用数据可视化分析。

听众收益:

  1. 了解监控的目的、纬度及相关指标;
  2. 了解Prometheus、Grafana 、Thanos监控工具的架构原理、特性及使用场景;
  3. 结合场景,了解各监控工具如何解决实际业务中所遇难题。

报名方式

添加社区小助手微信:xiaoyuerwise,备注「324」获取直播链接

关于 Meetup

AIOps Developer Meetup是由云智慧AIOps社区推出的,面向广大开发者的系列线上直播及线下分享活动,我们将汇聚AIOps社区专家团的力量给你提供优质的技术内容,无论是技术解读、开源治理、行业解决方案,相信广大developers总能在这里找到你想要的内容。

AIOps社区由云智慧发起,针对运维业务场景,提供算法、算力、数据集整体的服务体系及智能运维业务场景的解决方案交流社区。该社区致力于传播AIOps技术,旨在与各行业客户、用户、研究者和开发者们共同解决智能运维行业技术难题、推动AIOps技术在企业中落地、建设健康共赢的AIOps开发者生态。

往期回顾

上期Meetup由云智慧算法总监—严川分享了《AIOps指标相关算法体系分享》
主要内容回顾:

  1. AIOps(智能运维)算法体系总览
  2. AIOps异常检测算法场景深度剖析
  3. 解读AIOps预测场景

视频回放&ppt资料:添加文中小助手,备注“干货”获取。

Logo

权威|前沿|技术|干货|国内首个API全生命周期开发者社区

更多推荐