使用docker-compose搭建Prometheus+Grafana监控系统

选择完成后，打开新的页面，在HTTP的URL中输入Prometheus的地址http://192.168.3.250:9094，点击保存并测试。中搜索需要的Dashboard模版，并将其json文件下载下来。也可通过docker ps命令查看是否启动成功。打开http://192.168.3.250:3000，在Grafana菜单栏中第一个+号中，选择import。，在如下图所示中，选择Prom

ximeneschen

2001人浏览 · 2023-01-18 15:13:37

ximeneschen · 2023-01-18 15:13:37 发布

一、角色分配

Prometheus 采集数据
Grafana 用于图表展示
redis_exporter 用于收集redis的metrics
node-exporter 用于收集操作系统和硬件信息的metrics
cadvisor 用于收集docker的相关metrics

二、安装Docker

可以参考：https://ximeneschen.blog.csdn.net/article/details/104923157

三、安装Docker-Compose

参考：https://ximeneschen.blog.csdn.net/article/details/125651027

四、部署Prometheus和Grafana

新增Prometheus配置文件

首先，创建/data/prometheus/目录，然后创建prometheus.yml，填入如下内容：

global:
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration
alerting:
  alertmanagers:
  - static_configs:
    - targets: ['192.168.3.250:9093']
      # - alertmanager:9093

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  - "node_down.yml"
  # - "first_rules.yml"
  # - "second_rules.yml"

# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:
  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  - job_name: 'prometheus'

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.

    static_configs:
    - targets: ['192.168.3.250:9094']

  - job_name: 'redis'
    static_configs:
     - targets: ['192.168.3.250:9121']
       labels:
         instance: redis

  - job_name: 'node'
    scrape_interval: 8s
    static_configs:
     - targets: ['192.168.3.250:9100']
       labels:
         instance: node

  - job_name: 'cadvisor'
    static_configs:
     - targets: ['192.168.3.250:8088']
       labels:
         instance: cadvisori
         
  #基于文件自动加载新监控任务
  - job_name: 'file_ds'
    file_sd_configs:
    - files: ['/etc/prometheus/reload/*.yml']
      refresh_interval: 5s

接着创建node_down.yml,添加如下内容：

groups:
- name: node_down
  rules:
  - alert: InstanceDown
    expr: up == 0
    for: 1m
    labels:
      user: test
    annotations:
      summary: "Instance {{ $labels.instance }} down"
      description: "{{ $labels.instance }} of job {{ $labels.job }} has been down for more than 1 minutes."

创建docker-compose
继续在/data/prometheus/目录中创建docker-compose-prometheus.yml,添加如下内容：

version: '2'

networks:
    monitor:
        driver: bridge

services:
    prometheus:
        image: prom/prometheus
        container_name: prometheus
        hostname: prometheus
        restart: always
        volumes:
            - /data/prometheus/reload:/etc/prometheus/reload
            - /data/prometheus/prometheus.yml:/etc/prometheus/prometheus.yml
            - /data/prometheus/node_down.yml:/etc/prometheus/node_down.yml
        ports:
            - "9094:9090"
        networks:
            - monitor

    grafana:
        image: grafana/grafana
        container_name: grafana
        hostname: grafana
        restart: always
        ports:
            - "3000:3000"
        networks:
            - monitor
    redis-exporter:
        image: oliver006/redis_exporter
        container_name: redis_exporter
        hostname: redis_exporter
        restart: always
        ports:
            - "9121:9121"
        networks:
            - monitor
        command:
            - '--redis.addr=redis://192.168.3.250:6379'
            - '--redis.password=password'
    node-exporter:
        image: quay.io/prometheus/node-exporter
        container_name: node-exporter
        hostname: node-exporter
        restart: always
        ports:
            - "9100:9100"
        networks:
            - monitor

    mysql-exporter:
        image: prom/mysqld-exporter
        container_name: mysql-exporter
        hostname: mysql-exporter
        restart: always
        ports:
            - "9104:9104"
        networks:
            - monitor
        environment:
          DATA_SOURCE_NAME: "user:password@(192.168.3.250:3306)/"

    cadvisor:
        image: google/cadvisor:latest
        container_name: cadvisor
        hostname: cadvisor
        restart: always
        volumes:
            - /:/rootfs:ro
            - /var/run:/var/run:rw
            - /sys:/sys:ro
            - /var/lib/docker/:/var/lib/docker:ro
        ports:
            - "8088:8080"
        networks:
            - monitor

使用下面的命令启动docker-compose定义的容器

docker-compose -f /data/prometheus/docker-compose-prometheus.yml up -d

输入如下内容即代表启动成功：

Creating network "prometheus_monitor" with driver "bridge"
Creating cadvisor       ... done
Creating prometheus     ... done
Creating node-exporter  ... done
Creating redis_exporter ... done
Creating grafana        ... done

也可通过docker ps命令查看是否启动成功。如果要关闭并删除以上5个容器，只需要执行如下命令即可：

docker-compose -f /data/prometheus/docker-compose-monitor.yml down

同样也会输出如下日志：

Stopping cadvisor       ... done
Stopping node-exporter  ... done
Stopping grafana        ... done
Stopping redis_exporter ... done
Stopping prometheus     ... done
Removing cadvisor       ... done
Removing node-exporter  ... done
Removing grafana        ... done
Removing redis_exporter ... done
Removing prometheus     ... done
Removing network prometheus_monitor

复制代码
打开 http://192.168.3.250:9090/targets ，如果State都是UP即代表Prometheus工作正常，如下图所示：
在这里插入图片描述

CentOS7的防火墙firewall将对应的端口添加到防火墙策略里：

firewall-cmd --zone=public --add-port=9100/tcp --permanent
firewall-cmd --zone=public --add-port=8088/tcp --permanent
firewall-cmd --zone=public --add-port=9121/tcp --permanent
firewall-cmd --zone=public --add-port=3000/tcp --permanent
firewall-cmd --zone=public --add-port=9090/tcp --permanent
firewall-cmd --reload

可通过如下命令查看端口策略是否已经生效

firewall-cmd --permanent --zone=public --list-ports

五、配置Grafana

打开http://192.168.3.250:3000， 使用默认账号密码admin/admin登录并修改密码后，默认进来是创建数据库的页面，在如下图所示中，选择Prometheus。
在这里插入图片描述

选择完成后，打开新的页面，在HTTP的URL中输入Prometheus的地址http://192.168.3.250:9094，点击保存并测试。

在这里插入图片描述

使用Grafana模板进行数据展示，以Node-exporter为例子

在 https://grafana.com/grafana/dashboards 中搜索需要的Dashboard模版，并将其json文件下载下来。我本次主要监控node，于是只需要下载下面这个即可：
https://grafana.com/grafana/dashboards/17577-node-exporter-dashboard-22-04-17/
在Grafana菜单栏中第一个+号中，选择import

在这里插入图片描述
效果：

在这里插入图片描述

向您推荐>>Eolink开发者社区

权威｜前沿｜技术｜干货｜国内首个API全生命周期开发者社区

更多推荐

ELK实现containerd的容器日志采集展示【基于logging的全栈监测】

企业级ELK Stack构建介绍

云原生

深入理解 Mocha 测试框架：从零实现一个 Mocha

前言什么是自动化测试自动化测试在很多团队中都是Devops环节中很难执行起来的一个环节，主要原因在于测试代码的编写工作很难抽象，99%的场景都需要和业务强绑定，而且写测试代码的编写工作量往往比编写实际业务代码的工作量更多。在一些很多业务场景中投入产出比很低，适合写自动化测试的应该是那些中长期业务以及一些诸如组件一样的基础库。自动化测试是个比较大的概念，其中分类也比较多，比如单元测试，端对端测试，集

云原生

(20200916 Solved)docker-compose up创建容器自动退出

问题描述如题，创建容器后自动退出了。并且docker start container无效解决方案原因是缺失了控制终端的配置，需要在docker-compose.yml中增加tty:true ，有时候这样也不行，需要再增加一个command:/bin/bash，命令不一定是这个，需要是一个不会退出的命令，然后用-d后台启动容器。Referencesdocker-compose启动容器后自动退出...