IPMITool 使用简介:系统事件日志(SEL)与传感器监控
IPMITool 是一个跨平台的开源工具,用于管理和监控支持 IPMI(智能平台管理接口)的硬件设备。通过 IPMITool,用户可以获取硬件传感器的实时数据、查看系统事件日志(SEL)、远程控制服务器电源等。本文将重点介绍 ipmitool sel list 和 ipmitool sensor list 的使用方法,帮助管理员有效监控服务器状态。
ipmitool sel list:查看系统事件日志
系统事件日志(SEL)记录了与硬件相关的重要事件,例如温度异常、电源故障或内存错误。通过以下命令可以查看完整的 SEL 记录:
ipmitool sel list
输出示例:
1 | 04/01/2023 | 14:30:22 | Temperature #0x01 | Upper Critical going high | Asserted
2 | 04/01/2023 | 14:35:18 | Voltage #0x02 | Lower Non-critical | Deasserted
- 时间戳:记录事件的日期和时间。
- 事件类型:如温度、电压、风扇等传感器触发的事件。
- 严重程度:
Asserted(触发告警)或Deasserted(恢复正常)。
常用参数:
ipmitool sel clear # 清除所有日志记录(需谨慎操作)
ipmitool sel elist # 以扩展格式显示更详细的信息
ipmitool sensor list:监控硬件传感器状态
sensor list 用于查看服务器各个传感器的实时数据,包括 CPU 温度、风扇转速、电源电压等。运行以下命令获取传感器数据:
ipmitool sensor list
输出示例:
CPU Temp | 45.000 | degrees C | ok
System Fan | 3200 | RPM | ok
+12V Voltage | 11.876 | Volts | nc (低于阈值)
- 传感器名称:如
CPU Temp、System Fan。 - 当前值:如温度、转速或电压数值。
- 状态:
ok(正常)、nc(非临界告警)、cr(严重告警)。
过滤特定传感器:
ipmitool sensor get "CPU Temp" # 仅查看 CPU 温度
ipmitool sensor thresh "CPU Temp" # 查看该传感器的阈值设置
最佳实践
- 定期检查 SEL:通过自动化脚本定时导出 SEL 日志,便于分析历史故障。
- 传感器告警阈值:结合监控工具(如 Nagios、Zabbix)设置告警规则,及时响应异常。
- 安全注意事项:确保 IPMI 接口配置强密码,避免暴露于公网。
通过合理使用 ipmitool sel list 和 ipmitool sensor list,管理员可以快速定位硬件问题,提升系统稳定性。
更多推荐
所有评论(0)