logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GLM-5上线魔乐社区,基于昇腾的模型推理+训练部署教程请查收!

2026年2月12日,智谱AI开源GLM-5模型。在 Coding 与 Agent 能力上,取得开源 SOTA 表现,在真实编程场景的使用体感逼近 Claude Opus 4.5,擅长复杂系统工程与长程 Agent 任务。在全球权威的 Artificial Analysis 榜单中,GLM-5 位居全球第四、开源第一。昇腾一直同步支持智谱GLM系列模型,此次GLM-5模型一经开源发布,昇腾AI基础

文章图片
#人工智能#开源
全家桶集齐!Qwen3.5四款小模型上线魔乐社区,附昇腾全套实践教程

0.8B / 2B: 极致轻量,端侧首选特点:体积极小,推理速度极快。场景:非常适合移动设备、IoT 边缘设备部署,以及低延时的实时交互场景。4B:轻量级 Agent 的强劲基座特点:性能强劲,多模态基座模型,适合Agent。场景:适合作为轻量级智能体的核心大脑,完美平衡了性能与资源消耗。9B:紧凑尺寸,越级性能特点:结构紧凑,但性能媲美gpt-oss-120B,让人惊艳。场景:适合需要较高智力水

文章图片
#人工智能#开源
Qwen3.5教程第二弹!基于SGLang在昇腾上部署Qwen3.5新模型

继后,本次为大家带来SGLang框架下的昇腾部署实操指南,手把手教你完成 Qwen3.5系列开源模型的昇腾平台部署,轻松实现高效推理。本次教程适配Qwen3.5-397B-A17B、122B-A10B、35B-A3B、27B全系列模型,同时提供BF16原版权重与量化版本权重,满足不同开发需求。

文章图片
#sglang
在魔乐社区使用llama-factory微调Qwen3.5-4B模型

本文介绍了在昇腾NPU环境下微调Qwen3.5-4B大语言模型的完整流程。首先通过git-lfs下载Qwen3.5-4B模型和LlamaFactory框架,然后搭建基于miniconda的Python3.11环境并安装相关依赖包。接着配置昇腾NPU运行环境,下载并处理训练数据集(包含中英文版本),修改dataset_info.json文件添加数据集信息。最后提供了详细的训练YAML配置文件说明,包

文章图片
GLM-5.1登陆魔乐社区,NPU量化版同步上线,开发者速来!

4月8日,智谱GLM-5.1开源,该模型大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。GLM-5.1已上线魔乐社区,社区同步上线适配NPU的W4A8量化版,欢迎开发者下载体验!

文章图片
#人工智能#开源
小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区,基于昇腾的部署教程来了

继一周前模型开源发布后,千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型,也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式,在智能体编程方面达到了旗舰级表现,全面超越前代开源旗舰 Qwen3.5-397B-A17B(总参数397B / 激活参数17B的MoE模型)。作为稠密架构,它无需MoE路由即可部署,是开发者在实用、可广泛部署规模

#人工智能#开源
DeepSeek-V4开源上线魔乐社区,Day0解锁昇腾部署

万众期待的DeepSeek-V4终于来了!拥有。魔乐社区同步上线 DeepSeek开源权重 + 昇腾适配版,助你 Day0 开启“国产SOTA模型 × 国产算力” 双Buff加持的体验。同时,魔乐社区的DeepSeek专区已更新,将陆续上线DeepSeek-V4技术干货和更多国产算力适配模型,欢迎开发者关注体验!

#人工智能#开源
不用人类训练?这款开源大模型已开启自我进化

国产 AI 生态再添旗舰力作!4月12日,MiniMax M2.7正式开源并上线魔乐社区。M2.7 开启了模型的自我进化,也是MiniMax第一个 AI 深度参与迭代自己的模型。基于其在真实的软件工程、专业办公场景的优异表现,M2.7 已成为在 Hermes Agent、OpenClaw 等智能体工具中最受好评的模型之一。来自海内外的开发者与企业客户的接入需求持续增长,模型调用量在快速提升。

文章图片
#人工智能#开源
60B大模型装进手机不是梦,中国首个基于昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN开源

5 月 25 日至 29 日,面壁智能与 OpenBMB 联合举办「端侧大模型开源周」,每天解锁一个端侧大模型的杀手锏。端侧大模型的顶峰,不只在冰山一角,而在整座冰山。今天是开源周的第一弹:低比特大模型训练成果 BitCPM-CANN。该模型已上线魔乐社区,欢迎开发者下载体验!面壁智能联合清华大学、OpenBMB开源社区,正式发布并开源其在低比特大模型训练方向的最新成果——。

文章图片
#开源#人工智能
60B大模型装进手机不是梦,中国首个基于昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN开源

5 月 25 日至 29 日,面壁智能与 OpenBMB 联合举办「端侧大模型开源周」,每天解锁一个端侧大模型的杀手锏。端侧大模型的顶峰,不只在冰山一角,而在整座冰山。今天是开源周的第一弹:低比特大模型训练成果 BitCPM-CANN。该模型已上线魔乐社区,欢迎开发者下载体验!面壁智能联合清华大学、OpenBMB开源社区,正式发布并开源其在低比特大模型训练方向的最新成果——。

文章图片
#开源#人工智能
    共 232 条
  • 1
  • 2
  • 3
  • 24
  • 请选择