__无敌大西瓜__ 个人主页

@qq_60958172

__无敌大西瓜__

2025-08-23 01:59:28 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

如何在huggingface上下载模型？

本文以 google/gemma-3-27b-it 为例，系统总结了在 Hugging Face 下载模型的完整流程：首先在官网注册登录，进入模型主页完成授权并创建访问令牌（Access Token）；然后在服务器端配置 conda 环境，更换国内镜像源（如南科大）以加速 pip 和 conda 下载，安装 transformers 和 torch 等依赖；接着设置环境变量 HF_ENDPOINT

#人工智能 #服务器

如何使用MindStudio(msProf)进行Profiling？

本文介绍了在昇腾NPU服务器上部署vLLM推理环境并进行性能分析的完整流程。首先详细说明了服务器环境准备步骤，包括获取昇腾镜像、创建容器及常用Docker操作命令。其次重点分析了softmax算子的工程特性与硬件实现挑战，指出其因多阶段依赖、归约操作、非线性运算等特点成为衡量硬件性能的重要指标。最后提供了快速开始指南，指导用户通过MindStudio Insight工具进行算子性能分析，包括项目下

#人工智能 #CANN #性能优化

如何在裸机NPU服务器上配置CANN环境？

本文提供了昇腾AI环境配置的详细指南，主要包括：1) 关键软件版本对应关系（CANN Toolkit 8.1.RC1、PyTorch 2.5.1等）；2) 配置流程：从固件驱动安装到PyTorch、CANN Toolkit和Kernels的部署；3) 环境变量设置方法；4) 推荐操作系统（OpenEuler/Ubuntu）；5) 常见问题解决方案（权限问题、路径错误等）。特别强调要使用稳定版（be

#服务器 #CANN

如何创建容器化的昇腾工作环境？

摘要：本文介绍了在宿主机（配备8张Atlas910B2 NPU卡）上部署vLLM容器的完整流程。关键步骤包括：1）拉取24.9GB的专用镜像；2）以特权模式（--privileged必须）创建容器，挂载NPU设备及驱动目录；3）配置16G共享内存和多卡通信支持。特别指出昇腾NPU在非特权容器中会出现错误代码87，必须通过特权模式解决。最后提供了容器内验证NPU状态的常用命令。该方案适用于需要高性能

#人工智能 #服务器 #CANN

如何在NPU上部署大模型（Qwen3-30B-A3B）？

本文介绍了在NPU服务器上部署Qwen3-30B-A3B大模型的完整流程。主要内容包括：1）准备工作，如硬件要求、驱动安装、docker环境和镜像资源；2）详细部署步骤，包含镜像拉取、宿主机配置（设备挂载、模型路径映射）、容器内服务启动参数设置；3）验证方法，通过API接口测试和Python示例代码检查模型推理功能。特别强调了NPU设备挂载、tensor并行参数配置等关键环节，适用于OpenEul

#人工智能

如何在NPU上部署大模型（Qwen3-30B-A3B）？

#人工智能

到底了