
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
摘要:本文解析CANN算子库的算子融合技术,涵盖基础理论、性能优势及ops-nn中的典型实现。通过减少内存访问和kernel启动开销,融合算子可显著提升模型效率。重点介绍了AddRmsNorm、BatchNormElemt、FastGeLU等融合方案,展示了垂直/水平融合的优化策略,为昇腾AI处理器上的深度学习模型提供关键加速手段。(149字)
摘要:本文深入解析CANN算子库中控制流算子的实现原理与应用场景,重点探讨了Select/Where、NonZero和MaskedFill三类核心算子。通过理论分析结合代码实现,展示了如何在AI模型中高效处理条件分支、稀疏数据索引和掩码填充等动态控制需求。针对NPU硬件特性,文章详细介绍了向量化优化、并行计算和算子融合等关键技术,为开发者在昇腾平台上实现动态神经网络提供了实践指导。
本文详细记录了使用GitCode平台的免费昇腾Notebook实例,完成GPT-OSS-20B模型(一个21B参数的混合专家模型,激活参数3.6B)的环境配置、模型部署、性能测试与优化的全过程。通过编写自定义转换脚本将PyTorch模型转换为MindSpore格式,并在昇腾NPU上运行基准测试脚本,进行5次重复测试以获取可靠的数据统计。最终,我们评估了模型在不同场景下的推理速度和吞吐量,并提供了优

摘要:随着工业物联网(IIoT)和大数据的发展,海量时序数据处理需求激增。本文系统分析了时序数据库(TSDB)选型的7大核心维度,包括写入性能、存储效率、查询能力等,对比了InfluxDB、TimescaleDB等主流国外产品的优缺点。重点推荐了专为工业场景设计的开源解决方案Apache IoTDB,其具备树表双模型、超高压缩比、千万级写入吞吐等优势,并与大数据生态无缝集成。文章建议企业根据实际业

这种架构碎片化严重,接收、分析、告警、存储等模块分散,运维复杂且时延不可控,原始波形存文件、特征数据存时序库,导致异常回放不便、查询链路长,同时 FFT、窗口滑动、规则阈值等逻辑散落在不同程序中,规则调整需改代码、算法更新需重新发布,maintenance fee高。:增量计算与向量化处理减少了重复计算开销,紧凑的统一处理链避免了多进程并行运行带来的线程切换和内存冗余占用,在仅 2 核 CPU、8
本文介绍了在Windows系统上通过WSL2运行OpenClaw的详细安装指南。主要内容包括:1)安装WSL2和Ubuntu系统;2)启用systemd支持;3)克隆OpenClaw仓库并构建项目;4)安装Gateway服务的多种方式;5)配置局域网访问的端口转发方案;6)验证安装和常见问题排查。文章强调WSL2能提供更好的Linux兼容性,并提供了从基础安装到高级配置的完整流程,包括自动化脚本和

本文介绍了如何通过 OpenClaw + Agent-Reach 的组合,彻底解决 AI Agent"有脑无眼"的痛点。装好之后,OpenClaw 可以实时抓取 GitHub 数据、读取推特舆情、总结 B 站视频、搜索小红书口碑、订阅 RSS 定时推送——覆盖从技术调研到内容运营的全场景需求。模型再聪明,也需要一双能看见世界的眼睛。

本文提供了 OpenClaw 在 Windows、macOS、Linux 系统及 npm、pnpm 包管理器下的全平台完整卸载教程。

本文详细记录了使用GitCode平台的免费昇腾Notebook实例,完成GPT-OSS-20B模型(一个21B参数的混合专家模型,激活参数3.6B)的环境配置、模型部署、性能测试与优化的全过程。通过编写自定义转换脚本将PyTorch模型转换为MindSpore格式,并在昇腾NPU上运行基准测试脚本,进行5次重复测试以获取可靠的数据统计。最终,我们评估了模型在不同场景下的推理速度和吞吐量,并提供了优

Kurator是一个创新的分布式云原生平台,通过深度整合Kubernetes、Karmada、Istio等主流开源项目,为企业提供统一的多云管理解决方案。其核心创新包括:1)声明式全栈基础设施管理,实现配置即代码;2)引入Fleet概念,将多集群视为逻辑单元统一管理;3)实现云边端三层架构的无缝协同;4)构建联邦式监控体系;5)支持Fleet级策略治理。相比传统方案,Kurator显著降低了运维复








