logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

1 天落地 GLM-5.2:华为昇腾 910B 双机分布式推理保姆级教程(纯实操命令)

容器镜像:swr.cn-southwest-2.myhuaweicloud.com/base_image/dockerhub/lmsysorg/vllm-ascend:cann8.5.0-910b-glm5。--tensor-parallel-size 16:总张量并行 16 卡,Node0 占用 rank0-7,Node1 占用 rank8-15。--data-parallel-rpc-port

文章图片
#人工智能#华为#服务器 +3
1 天落地 GLM-5.2:华为昇腾 910B 双机分布式推理保姆级教程(纯实操命令)

容器镜像:swr.cn-southwest-2.myhuaweicloud.com/base_image/dockerhub/lmsysorg/vllm-ascend:cann8.5.0-910b-glm5。--tensor-parallel-size 16:总张量并行 16 卡,Node0 占用 rank0-7,Node1 占用 rank8-15。--data-parallel-rpc-port

文章图片
#人工智能#华为#服务器 +3
1 天落地 GLM-5.2:华为昇腾 910B 双机分布式推理保姆级教程(纯实操命令)

容器镜像:swr.cn-southwest-2.myhuaweicloud.com/base_image/dockerhub/lmsysorg/vllm-ascend:cann8.5.0-910b-glm5。--tensor-parallel-size 16:总张量并行 16 卡,Node0 占用 rank0-7,Node1 占用 rank8-15。--data-parallel-rpc-port

文章图片
#人工智能#华为#服务器 +3
SGLang、vLLM 和 MindIE 对比

大模型推理工具选型指南:vLLM、SGLang和MindIE各有专长。vLLM以PagedAttention技术实现高吞吐,适合批量推理场景;SGLang专注复杂交互应用,提供结构化输出和并行处理能力;MindIE则是华为昇腾硬件的专属加速套件。三者可互补使用,如MindIE可加速vLLM/SGLang在昇腾硬件上的性能。建议根据具体需求选择:高吞吐选vLLM,复杂应用选SGLang,昇腾硬件选M

文章图片
#AIGC#华为snap#copilot
Kimi K2在华为昇腾 800I A2安装过程(国产信创),含保姆级命令

在 华为昇腾 Atlas 800I A2 推理服务器 上部署 Kimi K2 大模型,推荐使用社区维护的 vLLM-Ascend 插件(专为昇腾 NPU 优化),配合 MindIE 镜像或 Docker 容器化部署,以规避复杂的驱动/依赖冲突。# 驱动:Ascend-hdk-atlas800i-a2-npu-driver_8.5.RC1_linux-aarch64.run。# 固件:Ascend-

文章图片
#人工智能#大数据#cloudera +3
GPUStack支持哪些具体AI大模型部署

GPUStack是一款开源GPU集群管理器,支持广泛AI大模型部署。核心功能包括智能调度GPU资源、自动配置部署参数,并集成多种主流推理后端(如vLLM、llama.cpp等)。支持模型类型涵盖:大语言模型(Llama、Qwen等系列)、多模态模型(Llava、Qwen-VL等)、嵌入与重排序模型(BGE系列)、文生图模型(Stable Diffusion)、语音模型(Whisper、FunASR

文章图片
#cloudera#hadoop
SGLang、vLLM 和 MindIE 对比

大模型推理工具选型指南:vLLM、SGLang和MindIE各有专长。vLLM以PagedAttention技术实现高吞吐,适合批量推理场景;SGLang专注复杂交互应用,提供结构化输出和并行处理能力;MindIE则是华为昇腾硬件的专属加速套件。三者可互补使用,如MindIE可加速vLLM/SGLang在昇腾硬件上的性能。建议根据具体需求选择:高吞吐选vLLM,复杂应用选SGLang,昇腾硬件选M

文章图片
#AIGC#华为snap#copilot
GPUStack 在华为昇腾 800I A2 服务器上的保姆级部署指南

本文提供了华为昇腾Atlas 800IA2服务器上部署GPUStack的完整指南,涵盖驱动安装、Docker配置、Ascend运行时安装及GPUStack部署全流程。通过详细命令和参数说明,指导用户在openEuler/Ubuntu系统上实现单机或多节点集群部署,支持MindIE后端的大模型推理。文章包含硬件要求检查、NPU状态确认、环境准备、容器化部署步骤,以及Qwen2.5-7B模型部署示例和

文章图片
#华为#服务器#运维 +1
GPU Stack与昇腾生态的深度融合路径:构建国产AI算力统一底座

摘要:GPUStack与华为昇腾生态的深度融合正加速推进,旨在构建国产AI算力统一底座。当前已实现CANN8.5基础兼容,未来将通过三大路径深化融合:技术层面实现原生深度协同(如开发昇腾专用适配层、优化MindIE2.3.0整合);生态层面共建开发者生态(联合培养、ISV绑定);商业层面创新服务模式(推出推理服务包、与华为云协同)。三年计划将分阶段完成深度集成、生态共建和标准引领,抓住信创替代和性

文章图片
#copilot
AI看图能力可能是“演出来的”:它在没看图时,也能答对80%

研究发现,当前多模态AI模型的"视觉能力"可能是一种假象。多项实验显示,主流模型在未接收图像输入的情况下,仅凭问题文本就能答对70%-80%的视觉问答题,准确率甚至超过有图时的情况。这种"无图推理"现象源于模型过度依赖语言先验知识和数据偏差,而非真正理解图像内容。研究人员通过对抗性测试证实,多数模型实际上是在"读题"而非"看图&

文章图片
#人工智能#深度学习#算法 +3
    共 258 条
  • 1
  • 2
  • 3
  • 26
  • 请选择