IPMITool 使用简介:系统事件日志(SEL)与传感器监控

IPMITool 是一个跨平台的开源工具,用于管理和监控支持 IPMI(智能平台管理接口)的硬件设备。通过 IPMITool,用户可以获取硬件传感器的实时数据、查看系统事件日志(SEL)、远程控制服务器电源等。本文将重点介绍 ipmitool sel listipmitool sensor list 的使用方法,帮助管理员有效监控服务器状态。

ipmitool sel list:查看系统事件日志

系统事件日志(SEL)记录了与硬件相关的重要事件,例如温度异常、电源故障或内存错误。通过以下命令可以查看完整的 SEL 记录:

ipmitool sel list

输出示例:

1 | 04/01/2023 | 14:30:22 | Temperature #0x01 | Upper Critical going high | Asserted
2 | 04/01/2023 | 14:35:18 | Voltage #0x02 | Lower Non-critical | Deasserted
  • 时间戳:记录事件的日期和时间。
  • 事件类型:如温度、电压、风扇等传感器触发的事件。
  • 严重程度Asserted(触发告警)或 Deasserted(恢复正常)。

常用参数:

ipmitool sel clear  # 清除所有日志记录(需谨慎操作)
ipmitool sel elist  # 以扩展格式显示更详细的信息

ipmitool sensor list:监控硬件传感器状态

sensor list 用于查看服务器各个传感器的实时数据,包括 CPU 温度、风扇转速、电源电压等。运行以下命令获取传感器数据:

ipmitool sensor list

输出示例:

CPU Temp      | 45.000 | degrees C | ok  
System Fan    | 3200   | RPM       | ok  
+12V Voltage  | 11.876 | Volts     | nc (低于阈值)
  • 传感器名称:如 CPU TempSystem Fan
  • 当前值:如温度、转速或电压数值。
  • 状态ok(正常)、nc(非临界告警)、cr(严重告警)。

过滤特定传感器:

ipmitool sensor get "CPU Temp"  # 仅查看 CPU 温度
ipmitool sensor thresh "CPU Temp"  # 查看该传感器的阈值设置

最佳实践

  • 定期检查 SEL:通过自动化脚本定时导出 SEL 日志,便于分析历史故障。
  • 传感器告警阈值:结合监控工具(如 Nagios、Zabbix)设置告警规则,及时响应异常。
  • 安全注意事项:确保 IPMI 接口配置强密码,避免暴露于公网。

通过合理使用 ipmitool sel listipmitool sensor list,管理员可以快速定位硬件问题,提升系统稳定性。

更多推荐