LZL_SQ 个人主页

@LZL_SQ

LZL_SQ

2022-12-09 16:55:26 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Rust 在云原生中的应用：使用 `kube-rs 构建 Kubernetes Operator

本文探讨了使用Rust语言(kube-rs库)开发Kubernetes Operator的最佳实践。Operator作为云原生自动化运维的核心模式，通过自定义资源(CRD)和调谐循环(Reconcile Loop)实现应用管理。Rust凭借其高性能(无GC)、高可靠性和出色的类型系统，相比Go语言在资源占用(5-10MB vs 60-100MB)和错误预防方面具有显著优势。文章详细解析了kube-

#云原生 #rust #kubernetes +2

Rust 游戏开发实战：Bevy 引擎的 ECS 架构与 2D 游戏构建

Bevy 是一个用 Rust 编写的、数据驱动、简单易用的游戏引擎。它以其快速的编译时间和现代的实体组件系统（Entity Component System, ECS）架构而闻名。本文将深入剖析 ECS 模式为何适合游戏开发，讲解 Bevy 引擎的核心概念（App, Plugin, System, Component, Entity），并实战构建一个完整的 2D 游戏（如“贪吃蛇”）。通过本文，读

#开发语言 #rust #后端

Rust FFI 深度实践：cxx 库与 C++ 的安全桥接

本文探讨了Rust与C++交互的安全解决方案cxx库。传统的unsafe FFI需手动处理类布局、异常和内存管理，存在安全隐患。cxx通过编译时代码生成和静态检查，提供类型安全的内存管理，支持双向零成本交互。实战演示了如何构建Rust调用C++类方法及C++回调Rust函数的完整流程。性能测试显示cxx在处理复杂类型时甚至优于手动FFI转换。该方案在保证安全性的同时，实现了近乎零开销的跨语言互操作

#开发语言 #rust #后端

Rust 密码学实践：使用 ring 和 rustls 构建安全信道

OpenSSL 作为事实上的 TLS 标准库，在过去几十年中暴露出许多严重的安全漏洞（如“心脏滴血” Heartbleed）。C语言：缺乏内存安全，易导致缓冲区溢出。代码陈旧：代码库庞大且复杂，难以审计。API 危险：API 设计易用错，导致安全隐患。ring：提供了安全、高性能的底层层加密原语（哈希、签名、加密），API 设计简洁且难以误用。rustls：纯 Rust 实现的 TLS库，性能媲美

#rust #密码学 #安全 +2

Rust 异步运行时原理：从 Future 到 Waker 再到 Executor

回调 (Callbacks)：(Node.js 早期) 逻辑分散，难以跟踪，导致“回调地狱”。协程 (Goroutines)：(Go 语言) M:N 调度，有栈协程，易于使用但内存开销大（~2KB 起步），且依赖运行时。：(JavaScript) 链式调用，解决了回调地狱，但前仍显繁琐。：无栈协程，Future只是一个状态机，内存开销极小小（几十字节），不依赖特定运行时。Taskasyncait：

#vim #编辑器 #开发语言 +2

昇腾Ascend C实战：手撕MoeGatingTopK融合算子与MoE架构性能狂飙

摘要：本文系统剖析了MoeGatingTopK融合算子在混合专家模型（MoE）中的核心作用，涵盖数学原理、AscendC实现及企业级部署全流程。作为CANN生态关键组件，该算子通过硬件协同优化（如DoubleBuffer、分块并行）实现专家路由的高效计算，支持万亿参数模型的低延迟推理。重点解析了TopK算法优化（O(n+klogk)复杂度）、负载均衡策略及分布式容错机制，并结合实战案例展示204

#开发语言 #昇腾 #架构 +1

Triton-Ascend性能测试工具解析：从Profiler到Benchmark的完整指南

本文深入探讨了昇腾NPU生态下的性能优化方法论，重点介绍了torch_npu.profiler工具和科学Benchmark设计两大核心技术。通过真实案例剖析，揭示了性能测试中常见的"自嗨"陷阱，并提供了从微观算子优化到宏观系统调优的全套解决方案。文章详细讲解了如何利用三层数据关联的Profiler精准定位瓶颈，以及设计工业级Benchmark的黄金法则，包括预热策略、多形状覆盖

#昇腾 #CANN

Atlas 300I/V Pro加速卡架构解析 - 从硬件基础到模型迁移实践

本文深入剖析Atlas300I/VPro AI加速卡在大模型训练中的实战应用。作者基于InternVL3千亿参数模型迁移经验，从硬件架构特性（达芬奇架构、内存层次）到模型移植关键步骤（梯度分片、混合精度训练），再到算子性能优化（内存对齐、向量化计算）进行了全面讲解。文章包含完整的矩阵乘示例代码、性能调优技巧（单卡78%利用率提升）以及企业级案例数据（训练时间从12.5s优化至2.3s）。特别强调故

#架构 #昇腾 #CANN

昇腾CANN与AsNumpy 数据科学计算范式的百倍重构之路

摘要：本文深入解析基于华为昇腾CANN架构的高性能科学计算库AsNumpy，揭示其从传统CPU到NPU的计算范式变革。通过AscendC编程模型，AsNumpy在张量运算规模突破临界点时实现百倍加速，核心在于智能内存管理、高效算子调度及硬件级优化。文章详细拆解其架构设计，包括NPUArray双缓冲机制、AscendC内核实现原理，并通过图像卷积实例展示实际应用。同时探讨企业级优化策略，展望AI原生

#python #开发语言 #昇腾 +1

Ascend C自定义Tiling参数解析 - 打造自适应算子

摘要本文深入解析了AscendC中自定义Tiling机制的核心原理与实践方法。Tiling作为NPU算子开发的"命门"，通过将大数据分块处理以适应芯片存储限制，显著提升计算效率。文章从静态与动态Tiling的对比入手，详细剖析了架构设计理念、核心算法实现和性能权衡。重点内容包括：动态Tiling结构体设计与Host-Device协作机制实战案例：构建支持动态Shape的

#人工智能 #昇腾 #CANN

共 73 条

请选择