开通阿里云云主机监控策略、以及系统报警服务配置、以及阿里云云服务的一键告警

Agent可以连接成是监控探头，要在各个服务器安装一个监控探头，看一下服务器的状态以及网络CPU内存磁盘都可以检测到，所以这个Agent安装到各个节点上就可以做监控了这样就监控到了各个节点点开之后还可以看到服务器各种各样的监控情况，如CPU的使用率，内存的使用率，系统平均负载情况，磁盘监控指标，读写的情况，以及公网的流量，公网磁盘的一些参数数据，以及进程的监控网络的监控，云盘的监控以及GPU的监控

字曰励志

218人浏览 · 2025-09-27 12:38:20

字曰励志 · 2025-09-27 12:38:20 发布

阿里云云主机监控策略

Agent可以连接成是监控探头，要在各个服务器安装一个监控探头，看一下服务器的状态以及网络CPU内存磁盘都可以检测到，所以这个Agent安装到各个节点上就可以做监控了

这样就监控到了各个节点
点开之后还可以看到服务器各种各样的监控情况，如CPU的使用率，内存的使用率，系统平均负载情况，磁盘监控指标，读写的情况，以及公网的流量，公网磁盘的一些参数数据，以及进程的监控网络的监控，云盘的监控以及GPU的监控，报警的规则，也就是看板

系统报警服务配置

设置告警联系人，还要设置告警组，因为很多时候不光要通知一个人，还需要通知一个团队，如运维组的工作人员以及领导，所以多个人要设置成一个组，告警的时候可以根据这个组统一进行告警工作
监控的指标可以有多个维度：比如实例维度磁盘维度地域维度实例维度用户维度网络维度GPU维度进程维度挂载的磁盘的维度都可以进行监控，提供了n多种监控的方式

这样告警联系人和告警组就都设置好了
简单指标是对某一项指标进行监控
组合指标主要是对多项指标联合进行监控，比如CPU占有率90%加上内存90%才会进行预警

通道沉默周期表示：在一定范围内，同样的告警只会发送一次，不会重复发送，要根据服务器的重要程度以及能接受的最长时间进行选择
生效时间为：周一到周日00：00-23：59，意味着7*24小时监控
报警回调可以做一些告警的系统，通过回调告诉告警信息
属于高级配置
恢复通知也要加上，服务器恢复正常也会通知

设置完成

有三台ECS服务器，但是这个配置是针对所有的ESC服务器的，要进行测试CPU达到阈值是否可以预警，只需要测试一台服务器的就可以

sh是运行shell脚本的命令
这个shell脚本里执行的是一个连续且不断触发的命令，这个命令会疯狂的占用CPU的资源，直到占用100%的资源

1分钟内是发短信，3分钟才是短信，这个是普通预警，然后是警告，最后是晋级

告警短信

正在报警的

以及报警历史

私有化大模型需要对GPU做各种各样的优化
设置报警规则分为：
1.设计报警联系人和组
2.设置报警规则
3.选择监控指标和设置报警方案
4.设置告警周期和联系人

测试完成后要退出这个shell脚本

✅ 立即解决方案：杀死这些 yes 进程

方法 1：逐个杀死（推荐）
kill 1936 1937 1938 1939
方法 2：一键杀死所有 yes 进程
pkill yes
或
killall yes
🔄 验证是否成功

执行完 kill 或 pkill yes 后，再次运行：
top -n 1
你应该会看到：

%Cpu(s): 使用率大幅下降（比如降到 1%~5%）

yes 进程消失

load average 开始下降

北京朝阳AI社区

更多推荐

Python入门教程零基础到精通

Python是一种高级编程语言，因其语法简洁、功能强大而深受欢迎。它可以用于Web开发、数据分析、人工智能、自动化脚本等多个领域。Python最大的特点就是易学易用，非常适合零基础学习。??')

北京朝阳AI社区

AI大数据赋能精准气候预测

传统的气候模型依赖于物理方程和数值模拟，但计算成本高昂且难以处理海量数据。人工智能（AI）和大数据技术的引入为气候模型模拟提供了新的可能性。以下将探讨如何结合AI和大数据技术优化气候模型模拟，并附上代码示例。常见的数据来源包括卫星遥感、地面观测站、海洋浮标和气候模型输出。是气候模型模拟的关键步骤。通过结合AI和大数据技术，气候模型模拟的精度和效率将显著提升。AI技术能够从历史气候数据中学习复杂的模

北京朝阳AI社区

AI+传感器驱动智能制造新未来

智能制造的核心在于通过实时数据采集与分析优化生产流程，而人工智能（AI）结合传感器大数据正成为这一领域的核心技术框架。传感器网络生成的海量数据通过AI算法处理，可实现预测性维护、质量控制、能源优化等目标。工业传感器（如振动、温度、压力传感器）以高频形式生成时序数据，需经过清洗和特征提取才能用于AI模型。通过上述技术路径，人工智能与传感器大数据的结合正在推动智能制造向自主决策、自适应优化的方向发展，