禁默个人主页

@2302_79376097

禁默

2024-06-19 15:59:30 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

在昇腾 NPU上压测 Qwen1.5-MoE：AtomGit 云端部署全记录

从日志中可以看到，在首次加载模型权重（约 29GB）并完成推理的全过程中，耗时控制在合理范围内。由于Qwen1.5-MoE 的基础权重高达 29GB，普通 32GB 显存卡通常只能支持极短的对话。这说明 Qwen1.5-MoE 的稀疏计算特性与 Atlas 800T A2 的高算力完美契合——并发越高，NPU 的流水线利用率越高，展现了极强的生产环境潜力。MoE 模型的参数量本身就很大（~29GB

在昇腾 NPU上跑通 Mistral-7B：从环境避坑到 100% 算力释放

目前的痛点主要在于 PyTorch 插件的易用性上（例如 accelerate 的自动映射支持还不够完美），导致我们必须手动写 .to("npu")。为了最大限度利用 NPU 算力，我们不能使用默认的 device_map="auto"，因为它依赖 accelerate 库进行设备调度，在 NPU 上极易报错 ValueError: requires accelerate。本文详细记录了如何在。在

#昇腾

在昇腾 NPU上跑通 Llama 3-8B：从环境部署到 100% 算力满载

Llama 3 是目前开源大模型的“流量担当”，而昇腾 (Ascend) 上的环境则是算力的“扛把子”。如果 AICore 始终很低，说明数据卡在 CPU 预处理上了（CPU 瓶颈），但在本例中，表现出了极佳的吞吐能力。在 FP16 精度下的表现非常强劲，对于企业构建私有化大模型底座而言，它已经不再是“备胎”，而是具备极高性价比的主力选择。最终，模型成功输出了完整的 Python 冒泡排序代码，

vLLM-Ascend 部署与推理服务化实战

vLLM 是目前大模型推理领域最火热的高性能推理框架之一，以其 PagedAttention 技术著称。而 vLLM-Ascend 则是 vLLM 在华为昇腾 NPU 上的硬件插件，使得昇腾算力能够通过 vLLM 释放强大的推理性能。在真正开始做迁移之前，我原本以为 GPU 和 NPU 在推理框架上的适配会非常复杂，但上手后才发现，vLLM-Ascend 的设计思路非常清晰：它在底层为昇腾补齐了算

基于Rokid灵珠AI平台的春节全能助手智能体开发实践

本次开发基于Rokid灵珠AI平台，聚焦春节高频的抢票出行、路线规划、年货比价核心场景，搭建轻量化春节全能助手智能体，通过平台可视化工作流编排实现功能逻辑串联；因无Rokid Glasses实物，智能体完成灵珠平台内对话测试验证，眼镜端适配仅编写伪代码实现逻辑预留，整体开发聚焦平台核心的智能体配置与工作流开发能力，实现低门槛、高适配的春节场景AI应用落地。本次基于Rokid灵珠AI平台的春节出行助

#microsoft #数据库 #windows

基于Rokid灵珠AI平台的春节全能助手智能体开发实践

#microsoft #数据库 #windows

摆脱局域网束缚！PandaWiki+cpolar内网穿透实操，随时随地查资料

cpolar 是一款内网穿透工具，可以将你在局域网内运行的服务（如本地 Web 服务器、SSH、远程桌面等）通过一条安全加密的中间隧道映射至公网，让外部设备无需配置路由器即可访问。广泛支持 Windows、macOS、Linux、树莓派、群晖 NAS 等平台，并提供一键安装脚本方便部署。本文从零带你在飞牛NAS上部署并用好 PandaWiki：完成安装、初始配置与模型接入（以 DeepSeek 为

#网络

从0到1打造专业职配助手：基于openJiuwen记忆库新特性的AI职业规划实战

最近基于openJiuwen框架，用它最新推出的独立记忆库功能，搭建了一个“专业职配助手”智能体。它不仅能依托行业知识库给出专业-岗位匹配建议，更能通过记忆库记住用户的专业背景、职业偏好，实现跨智能体的个性化推荐。今天就把从模型配置到智能体测试的全流程拆解给你，重点聊聊记忆库如何让AI真正“懂你”。知识库是广度：没有高质量的行业数据，智能体就会泛泛而谈，精确的知识库，内容更加规范，具有可信度；记忆

#人工智能

从0到1打造专业职配助手：基于openJiuwen记忆库新特性的AI职业规划实战

#人工智能

告别设备和网络束缚✨VSCode+WSL+cpolar 让开发环境随身走

VSCode+WSL+cpolar 的组合，核心是打破开发环境的网络和设备限制，让开发者能在不同场景下便捷使用熟悉的开发工具链，同时简化团队协作的环境适配问题，是提升日常开发效率的实用方案。

#AIGC

共 151 条

请选择