
简介
提供行业领先的数字化可观测解决方案,让您的业务运行更安全、更稳定。
擅长的技术栈
可提供的服务
免费试用:https://www.databuff.com/apply
文章探讨了企业遗留系统("古早应用")监控面临的挑战,这些系统多为早期开发的C/C++/汇编程序及老版本JDK应用,难以采用传统字节码增强技术进行监控。作者介绍了一种基于eBPF技术的"LightAPM"轻量级监控方案,该方案无需修改代码或重启应用,通过安装OneAgent即可实现自动化的服务拓扑绘制、性能指标采集和问题诊断。该技术能自动发现服务资产、构建调

文章介绍了如何利用商业可观测平台DataBuff接管开源链路工具SkyWalking,实现一键接入和智能故障定位。通过修改SkyWalking Agent的数据接收地址指向DataBuff服务器,用户可快速构建监控管道。演示中,测试环境部署了大模型Demo应用和DataBuff平台,通过停止MySQL容器制造故障后,DataBuff的因果AI引擎成功识别出数据库异常导致的接口故障,并提供根因分析和

文章介绍了如何利用商业可观测平台DataBuff接管开源链路工具SkyWalking,实现一键接入和智能故障定位。通过修改SkyWalking Agent的数据接收地址指向DataBuff服务器,用户可快速构建监控管道。演示中,测试环境部署了大模型Demo应用和DataBuff平台,通过停止MySQL容器制造故障后,DataBuff的因果AI引擎成功识别出数据库异常导致的接口故障,并提供根因分析和

本文深度解析一款商用级OneAgent从零自研的全过程。揭秘我们如何实现50MB内存占用、非Root安装、SQL实时查询及采集即治理等核心特性,并分享在轻量化、易用性与可扩展性方面的架构设计思考,为构建企业级可观测平台提供数据基石

本文深度解析一款商用级OneAgent从零自研的全过程。揭秘我们如何实现50MB内存占用、非Root安装、SQL实时查询及采集即治理等核心特性,并分享在轻量化、易用性与可扩展性方面的架构设计思考,为构建企业级可观测平台提供数据基石

本文对主流APM监控探针的Java Agent启动耗时进行性能评测,发现在云原生高频发布场景下,探针启动延迟直接影响容器生命周期。测试结果显示:Databuff探针启动最快(43秒),相比基准33秒仅增加30.3%;SkyWalking最慢(66秒)。分析指出Databuff的优势源于按需字节码注入、异步上报等创新设计,并给出K8s配置优化建议,如针对不同探针调整startupProbe阈值。文章

本文对主流APM监控探针的Java Agent启动耗时进行性能评测,发现在云原生高频发布场景下,探针启动延迟直接影响容器生命周期。测试结果显示:Databuff探针启动最快(43秒),相比基准33秒仅增加30.3%;SkyWalking最慢(66秒)。分析指出Databuff的优势源于按需字节码注入、异步上报等创新设计,并给出K8s配置优化建议,如针对不同探针调整startupProbe阈值。文章

2025年7月23日,由中国通信标准化协会主办的 “2025可信云大会” 在京举行,《运维智能体(SRE AGENT)能力要求》标准正式发布,杭州乘云数字作为运维智能体及可观测领域领导者,重点参与了本次报告的编写。

【摘要】2025年6月,龙蜥社区在济南举办"智算中心智能运维技术"Meetup,阿里云、浪潮信息等专家探讨AI与运维融合趋势。杭州乘云数字联合创始人张怀鹏分享《多模态AI在可观测平台的应用实践》,指出传统运维存在指标孤岛、信息过载等痛点,提出通过多模态AI(LLM、知识图谱)实现自动化关联分析、智能诊断等突破,将被动监控升级为主动洞察。该方案显著提升运维效率,代表未来智能运维发展方向。

OpenTelemetry是由OpenTracing和OpenCensus两个开源项目合并而成,由云原生计算基金会(CNCF)托管。该项目旨在提供一套标准化的、跨语言的观测性工具,帮助开发人员和运维人员更好地理解和管理分布式系统的性能和行为。通过统一的Metrics(指标)、Logs(日志)和Traces(追踪)数据模型,OpenTelemetry使得数据收集、处理和分析变得更加高效和便捷。
