
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
建设了容灾系统,然后呢?出于业务连续性与数据保护等目的,最早是银行等金融机构完成了业务的容灾系统的建设,随后电力等关键能源行业、海关等政务单位、大型互联网公司都着手建设了完备的业务容灾系统。但是当容灾系统建设完毕后,大家发现一个尴尬的问题:容灾系统是有了,但只要不是逼不得已,没人愿意进行容灾的切换演练,更别提正式切换了,这是为什么呢?这是因为容灾系统往往都很复杂:每个企业的灾备环境不同:冷备容
运维自动化巡检就是把对网络、服务器、服务/应用的巡检手动操作转变成自动化的形式。

蓝鲸社区S-mart市场一直为大家免费提供一些脚本工具、应用系统、以及一些实用插件。作为蓝鲸唯一的一级合作伙伴,本次嘉为蓝鲸为S-mart市场倾情贡献了一款小工具:网络拓扑自动扫描工具,一起来了解一下吧!

云系统异常检测背景随着云技术的飞速发展,云系统的复杂性和规模不断增加,云系统的稳定性受到了极大挑战。为了解决运维问题,运营商会通过指标(Metrics)、日志(Logs)等多个维度信息来了解云系统的运行状态。本文介绍的方法是通过分析系统指标(如CPU 使用率、I/O 请求数、网络吞吐量等)对云系统进行异常检测。对于这些指标数据,研究人员提出了单变量的时间序列异常检测方法。但随着云系统复杂性的增加,

IT运维领域要保障服务正常运行,通常第一步是将运维的对象监控起来,这其中主要就是对运维对象的指标进行实时监控:通过设定的(算法)规则对指标进行实时检测,当某个指标值不符合设定的规则时,则判定为异常,然后发送相应的告警到告警平台。告警平台收到告警后,会分配给对应的运维人员进行处理,运维人员根据告警信息来排查问题所在,最终定位故障的根本原因,并对故障进行修复。从这个流程可以看出,整个过程是以告警为中心

背景运维日志一般指的是计算机系统、设备、软件等在某种情况下记录的信息,而从运维人员所维护对象的所有信息来看,日志则是一个非常重要的组成部分。它可以记录下系统产生的所有行为,并依照某种范式表达出来。我们可以使用日志所记录的信息为系统进行排错,实时洞察系统的变化,或者根据这些信息调整系统的行为等等。但是随着软件系统的发展,面对繁多,复杂,非结构化的日志,人工如何从中获取有效的信息变成了一大难题,上期我

嘉为蓝鲸LLMOps平台+DeepSeek:为运维全生命周期及业务通用AI 场景提供工具支持与自定义扩展能力;10+震撼智能运维场景分享。

本文深入探讨自动化运维规划,介绍OASR模型设计,阐述自动化运维能力分级、优先级划分及规划方法,为企业构建自动化运维系统提供指引。

随着技术的快速发展,检索增强生成(RAG)成为构建智能知识库的核心方案。嘉为蓝鲸 OpsPilot基于 RAG 技术打造高效知识处理体系,在 RAG 预处理环节,提取与分块技术通过精准解析文档结构、拆分语义单元为后续处理奠定基础。而在知识处理的 “下半场”,作为连接预处理与大模型应用的关键桥梁,前者做“翻译家”,把文本变成机器能懂的数字密码,后者则是 “导航器”,用这些密码在知识库快速找到答案。在

此外,OpsPilot更加聚焦于运维领域,超出单个LLM大模型的能力范畴,成为更懂运维的智能AI平台。通过这一技术,OpsPilot 能够将企业各个业务系统的实时数据接入AI平台,结合联网检索与私域知识库沉淀的专业经验,形成立体化的知识网络,涵盖运维知识库数据、 CMDB信息,以及全量工单记录等数据,将这些关键信息统一接入OpsPilot 的智能体,实现运维智能化。








