logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【博客635】tcpdump原理与网卡混杂模式

tcpdump原理是注册一种虚拟协议,使得每个包在遍历当前的协议列表时有机会被处理,如果tcpdump发现包符合要求就会使用skb_clone一份,送到用户态程序去分析。tcpdump还会使网络设备进入混杂模式,是为了让包能过进入网络协议栈,从而有机会被捕捉,这样才能抓到包。

文章图片
#tcpdump#网络#linux
【博客183】C++ “static_cast“ 与 “强制转换“

内容: 记录C++中的static_cast与强制转换的区别"static_cast"与“强制转换”的区别一:无关类型的指针之间转换1.static_cast进行无关类型的指针之间转换:#include<iostream>using namespace std;class A{int a;};class B{int b;}...

【博客655】prometheus如何应对告警目标消失带来的评估缺失问题

基于拉取的监控(例如 Prometheus)的优势之一是,您可以在抓取过程中判断目标是否健康。关于 Prometheus 的一个常见问题是如何判断服务器是否没有响应或检测样本是否不再从目标中摄取。简单黑盒监控的首选工具是黑盒导出器,您可以使用 unless 和 offset 进行边缘检测,以检测时间序列是否未更新。然而,有一种更简单的方法可以涵盖大多数用例。1、它不是来自 scrape 本身,所以

文章图片
#prometheus#开发语言#linux +1
【博客619】PromQL如何实现Left joins以及不同metrics之间的复杂联合查询

在限定匹配标签后,右向量中的元素可能匹配到多个左向量中的元素 因此该表达式的匹配模式为多对一,需要使用group修饰符group_left指定左向量具有更好的基数。多对一和一对多两种匹配模式指的是“一”侧的每一个向量元素可以与"多"侧的多个元素匹配的情况。在这种情况下,必须使用group修饰符:group_left或者group_right来确定哪一个向量具有更高的基数(充当“多”的角色)。多对一

#kubernetes
【博客488】prometheus-----长尾问题,跳变问题,数据外推问题,增量丢失问题

使用rate或者increase函数去计算样本的平均增长速率,容易陷入“长尾问题”当中,其无法反应在时间窗口内样本数据的突发变化。例如,对于主机而言在2分钟的时间窗口内,可能在某一个由于访问量或者其它问题导致CPU占用100%的情况,但是通过计算在时间窗口内的平均增长率却无法反应出该问题。irate函数相比于rate函数提供了更高的灵敏度,不过当需要分析长期趋势或者在告警规则中,irate的这种灵

#prometheus#算法
【博客617】prometheus + alertmanager的搭配如何判定告警恢复

prometheus触发告警恢复:对于已经恢复的告警指标,如果之前是pending或者之前的ResolvedAt非空,且在resolvedRetention(15m)之前的,则删除此告警;否则更新告警的状态为恢复,且恢复的时间为当前时间对告警进行判断是否需要发送恢复时间是大于上次发送告警的时间,证明恢复是在告警后发生的,那么已经恢复了,需发送恢复设置告警的ValidUntil,如果这条告警过了Va

#prometheus#运维#服务器
【博客630】MTU网络问题排查及解决思路

网络层发送数据包是有最大长度的,网络层从传输层接收到要发送的数据包时,它要判断向本地哪个接口发送数据,并查询该接口获得其最大传输单元MTU(MaximumTransmissionUnit),网络层把MTU值与要发送的IP数据包长度进行比较,如果IP数据包的长度比MTU值大,那么IP数据包就需要进行分片,分片后的数据包长度小于等于MTU(包括IP层头部,大小单位:byte)

文章图片
#网络#linux#运维
【博客486】prometheus-----rate,irate,increase的原理

比如:irate(node_network_receive_packets_total{device=~”en.*”}[1m])因为只用最后两个点的差值来计算,会比 rate 平均值的方法得到的结果,变化更加剧烈,更能反映当时的情况。那既然是使用最后两个点计算,这里又为什么需要 [1m] 呢?

#prometheus
【博客501】Nvidia docker runtime原理

docker 本身并不原生支持GPU,但使用docker的现有功能可以对GPU的使用进行支持。如上所述,通过 --device 来指定挂载的GPU设备,通过 -v 来将宿主机上的 nvidia gpu 的命令行工具和相关的依赖库挂载到容器。这样,在容器中就可以看到和使用宿主机上的GPU设备了。这样使用,对于GPU的可用性(哪些GPU是空闲的等)需要人为的判断,效率很低。

#docker#容器#运维
【博客674】警惕Prometheus 中的重复样本和无序时间戳错误

但 Prometheus 可能会出现错误配置,导致多个目标共享相同的标签集,这可能会导致结果时间序列之间的标签集冲突。然后,TSDB 会将多个原始系列的流视为单个系列,但当它们的样本因无序或重复时间戳而相互冲突时,会拒绝无效追加。但是,Prometheus 可能会出现错误配置,导致 Prometheus 尝试附加到 TSDB 时获得重复或无序的样本时间戳,但未能成功。当样本具有不同的样本值时,它还

文章图片
#prometheus#golang#linux +2
    共 88 条
  • 1
  • 2
  • 3
  • 9
  • 请选择