
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
来源:腾讯技术工程 刘天斯https://mp.weixin.qq.com/s/YHR50kF2QOgjMi83WbwuzA1、什么是SRE利用 SRE 的思想与方法,不断去冲刺稳定性的终极目标:“提升 MTBF(平均故障时间间隔)、降低 MTTR(故障平均修复时间)”,很多小伙伴会有疑问,DevOps 与 SRE 到底是什么样的关系?SRE 是 DevOps 的一种实现方式团队构建的玄图-SRE
CAdvisor是谷歌开发的用于分析运行中容器的资源占用和性能指标的开源工具。CAdvisor是一个运行时的守护进程,负责收集、聚合、处理和输出运行中容器的信息。docker监控也需要用一个exporter,这个exporter就是cAdvisor,类似zabbix的各种agent

你需要学习docker,部署容器,然后学会nginx代理web服务器,然后要维护服务器的各种状态和突发事件,还要学会写自动化脚本,比如shell,python,ruby, php这些语言都可以写linux的运维脚本。然后要定点监测某些站点啊,端口啊,ip啊等。。。这些是否正常。运维分为 网站运维,基础运维(域名申请,购买/租用服务器,上架,调整网络设备的位置,部署操作系统和运行环境,部署代码,设.
通俗易懂K8s0. k8s 的架构1. 核心组件原理 —— pod 核心原理1.1 pod 是什么1.2 pod 用来干什么1.3 实现 web 服务集群1.4 pod 底层网络和数据存储是如何进行的2. ReplicaSet 副本控制器2.1 副本控制器基本理解2.2 ReplicaSet 和 ReplicationController 的区别3. Deployment 部署对象3.1 滚动更新
监控对象:1.监控对象的理解:CPU是怎么工作的,原理2.监控对象的指标:CPU使用率 CPU负载 CPU个数 上下文切换3.确定性能基准线:怎么样才算故障?CPU负载多少才算高监控范围:1.硬件监控 服务器的硬件故障2.操作系统监控 CPU 内存 IO 进程3.应用服务监控4.业务监控1.硬件监控(机房)硬件监控:1.使用IPMI2.机房巡检
来源:腾讯技术工程 刘天斯https://mp.weixin.qq.com/s/YHR50kF2QOgjMi83WbwuzA1、什么是SRE利用 SRE 的思想与方法,不断去冲刺稳定性的终极目标:“提升 MTBF(平均故障时间间隔)、降低 MTTR(故障平均修复时间)”,很多小伙伴会有疑问,DevOps 与 SRE 到底是什么样的关系?SRE 是 DevOps 的一种实现方式团队构建的玄图-SRE
1、如何通过命令行重启linux操作系统?#reboot2、如何在命令行中快速删除光标前/后的内容?前:ctrl+u后:ctrl+k3、如何删除 /tmp下所有A开头的文件?#rm -f /tmp/A*4、系统重要文件需要备份,如何把/etc/passwd备份到/tmp目录下? #cp /etc/passwd /tmp/5、如何查看系统最后创建的3个用户?#...
你需要学习docker,部署容器,然后学会nginx代理web服务器,然后要维护服务器的各种状态和突发事件,还要学会写自动化脚本,比如shell,python,ruby, php这些语言都可以写linux的运维脚本。然后要定点监测某些站点啊,端口啊,ip啊等。。。这些是否正常。运维分为 网站运维,基础运维(域名申请,购买/租用服务器,上架,调整网络设备的位置,部署操作系统和运行环境,部署代码,设.
Python 自动化运维实现ssh 远程登录管理设备 案例
初步认识ansible







