logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

在昇腾 NPU上压测 Qwen1.5-MoE:AtomGit 云端部署全记录

从日志中可以看到,在首次加载模型权重(约 29GB)并完成推理的全过程中,耗时控制在合理范围内。由于Qwen1.5-MoE 的基础权重高达 29GB,普通 32GB 显存卡通常只能支持极短的对话。这说明 Qwen1.5-MoE 的稀疏计算特性与 Atlas 800T A2 的高算力完美契合——并发越高,NPU 的流水线利用率越高,展现了极强的生产环境潜力。MoE 模型的参数量本身就很大(~29GB

文章图片
在昇腾 NPU上跑通 Mistral-7B:从环境避坑到 100% 算力释放

目前的痛点主要在于 PyTorch 插件的易用性上(例如 accelerate 的自动映射支持还不够完美),导致我们必须手动写 .to("npu")。为了最大限度利用 NPU 算力,我们不能使用默认的 device_map="auto",因为它依赖 accelerate 库进行设备调度,在 NPU 上极易报错 ValueError: requires accelerate。本文详细记录了如何在。在

文章图片
#昇腾
在昇腾 NPU上跑通 Llama 3-8B:从环境部署到 100% 算力满载

Llama 3 是目前开源大模型的“流量担当”,而昇腾 (Ascend) 上的环境 则是算力的“扛把子”。如果 AICore 始终很低,说明数据卡在 CPU 预处理上了(CPU 瓶颈),但在本例中,表现出了极佳的吞吐能力。在 FP16 精度下的表现非常强劲,对于企业构建私有化大模型底座而言,它已经不再是“备胎”,而是具备极高性价比的主力选择。最终,模型成功输出了完整的 Python 冒泡排序代码,

文章图片
vLLM-Ascend 部署与推理服务化实战

vLLM 是目前大模型推理领域最火热的高性能推理框架之一,以其 PagedAttention 技术著称。而 vLLM-Ascend 则是 vLLM 在华为昇腾 NPU 上的硬件插件,使得昇腾算力能够通过 vLLM 释放强大的推理性能。在真正开始做迁移之前,我原本以为 GPU 和 NPU 在推理框架上的适配会非常复杂,但上手后才发现,vLLM-Ascend 的设计思路非常清晰:它在底层为昇腾补齐了算

文章图片
基于Rokid灵珠AI平台的春节全能助手智能体开发实践

本次开发基于Rokid灵珠AI平台,聚焦春节高频的抢票出行、路线规划、年货比价核心场景,搭建轻量化春节全能助手智能体,通过平台可视化工作流编排实现功能逻辑串联;因无Rokid Glasses实物,智能体完成灵珠平台内对话测试验证,眼镜端适配仅编写伪代码实现逻辑预留,整体开发聚焦平台核心的智能体配置与工作流开发能力,实现低门槛、高适配的春节场景AI应用落地。本次基于Rokid灵珠AI平台的春节出行助

文章图片
#microsoft#数据库#windows
基于Rokid灵珠AI平台的春节全能助手智能体开发实践

本次开发基于Rokid灵珠AI平台,聚焦春节高频的抢票出行、路线规划、年货比价核心场景,搭建轻量化春节全能助手智能体,通过平台可视化工作流编排实现功能逻辑串联;因无Rokid Glasses实物,智能体完成灵珠平台内对话测试验证,眼镜端适配仅编写伪代码实现逻辑预留,整体开发聚焦平台核心的智能体配置与工作流开发能力,实现低门槛、高适配的春节场景AI应用落地。本次基于Rokid灵珠AI平台的春节出行助

文章图片
#microsoft#数据库#windows
摆脱局域网束缚!PandaWiki+cpolar内网穿透实操,随时随地查资料

cpolar 是一款内网穿透工具,可以将你在局域网内运行的服务(如本地 Web 服务器、SSH、远程桌面等)通过一条安全加密的中间隧道映射至公网,让外部设备无需配置路由器即可访问。广泛支持 Windows、macOS、Linux、树莓派、群晖 NAS 等平台,并提供一键安装脚本方便部署。本文从零带你在飞牛NAS上部署并用好 PandaWiki:完成安装、初始配置与模型接入(以 DeepSeek 为

文章图片
#网络
从0到1打造专业职配助手:基于openJiuwen记忆库新特性的AI职业规划实战

最近基于openJiuwen框架,用它最新推出的独立记忆库功能,搭建了一个“专业职配助手”智能体。它不仅能依托行业知识库给出专业-岗位匹配建议,更能通过记忆库记住用户的专业背景、职业偏好,实现跨智能体的个性化推荐。今天就把从模型配置到智能体测试的全流程拆解给你,重点聊聊记忆库如何让AI真正“懂你”。知识库是广度:没有高质量的行业数据,智能体就会泛泛而谈,精确的知识库,内容更加规范,具有可信度;记忆

文章图片
#人工智能
从0到1打造专业职配助手:基于openJiuwen记忆库新特性的AI职业规划实战

最近基于openJiuwen框架,用它最新推出的独立记忆库功能,搭建了一个“专业职配助手”智能体。它不仅能依托行业知识库给出专业-岗位匹配建议,更能通过记忆库记住用户的专业背景、职业偏好,实现跨智能体的个性化推荐。今天就把从模型配置到智能体测试的全流程拆解给你,重点聊聊记忆库如何让AI真正“懂你”。知识库是广度:没有高质量的行业数据,智能体就会泛泛而谈,精确的知识库,内容更加规范,具有可信度;记忆

文章图片
#人工智能
告别设备和网络束缚✨VSCode+WSL+cpolar 让开发环境随身走

VSCode+WSL+cpolar 的组合,核心是打破开发环境的网络和设备限制,让开发者能在不同场景下便捷使用熟悉的开发工具链,同时简化团队协作的环境适配问题,是提升日常开发效率的实用方案。

文章图片
#AIGC
    共 151 条
  • 1
  • 2
  • 3
  • 16
  • 请选择