logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qwen3.5高性能算子完整接入指南:从环境搭建到生产部署,让GDN性能真正翻倍(实操版)

把这9步走完,你的Qwen3.5就已经从"理论性能"变成了"实际性能"。1. 环境一致性大于一切FlashQLA对硬件和软件版本的要求非常严格。SM90、CUDA 12.8、PyTorch 2.8这三个条件缺一不可。很多开发者卡在编译环节,其实90%都是版本不匹配导致的。2. 精度验证不能省算子替换后,模型输出"看起来正常"不等于真的正常。一定要用自动化脚本做批量对比,数值误差在1e-3以内才算安

文章图片
#python
大模型部署必看:Qwen3.5 算子替换让 GDN 性能翻倍(概念版)

《Qwen3.5性能优化实战:FlashQLA算子加速指南》概念版——摘要 阿里开源Qwen3.5系列采用GatedDeltaNetworks(GDN)架构,理论上可降低60%显存占用并提升19倍吞吐量,但实际部署中常因算子未优化导致性能不达预期。本文详解GDN架构将计算复杂度从二次降为线性的原理,并介绍专用加速引擎FlashQLA的四大优化:

文章图片
vscode推荐插件

史上最全前端插件安装来啦~先来看看我的vscode里装了那些插件吧

#vscode#编辑器#git +3
git下载安装及使用

【Git入门指南】针对职场新人提供Windows系统下Git安装与基础使用教程。安装部分详解官方下载步骤及推荐配置选项(默认vim编辑器、Fast-forward合并方式等)。核心操作包括:初始化仓库、克隆项目、分支管理(创建/切换/合并)、代码提交与同步。特别强调分支规范(个人分支不能直接合并到master)。教程提供6个常用命令详解和典型工作场景示例,如拉取主分支最新代码、合并到dev分支等流

#git#学习
​2026最新保姆级教程:从零开始“养龙虾”(OpenClaw专属AI智能体搭建指南)

OpenClaw(代号:龙虾)是一款轻量化、开源的 AI 智能体执行框架,可与大模型深度结合,实现等核心能力,能够支撑 AI 完成数小时至数天的连续工程任务,无需人工实时干预,是大模型从 “对话工具” 向 “全自动生产力” 升级的关键支撑组件。

#人工智能
​2026最新保姆级教程:从零开始“养龙虾”(OpenClaw专属AI智能体搭建指南)

OpenClaw(代号:龙虾)是一款轻量化、开源的 AI 智能体执行框架,可与大模型深度结合,实现等核心能力,能够支撑 AI 完成数小时至数天的连续工程任务,无需人工实时干预,是大模型从 “对话工具” 向 “全自动生产力” 升级的关键支撑组件。

#人工智能
开源重磅|智谱GLM-5.1:告别“只会说”,成为能独立干活的全自动AI

GLM-5.1开源大模型突破AI长程任务能力瓶颈,实现了持续8小时以上的独立工程开发能力。该模型在三大硬核测试中表现惊艳:从零构建完整操作系统UI、655次迭代优化向量数据库性能7倍、14小时底层算子优化实现3.6倍加速。其突破性在于具备长程规划、自适应纠错和超长上下文整合能力,在SWE-benchPro测试中超越ClaudeOpus4.6登顶全球第一。这标志着中国开源AI已跻身世界第一梯队,为开

文章图片
#开源#人工智能
开源重磅|智谱GLM-5.1:告别“只会说”,成为能独立干活的全自动AI

GLM-5.1开源大模型突破AI长程任务能力瓶颈,实现了持续8小时以上的独立工程开发能力。该模型在三大硬核测试中表现惊艳:从零构建完整操作系统UI、655次迭代优化向量数据库性能7倍、14小时底层算子优化实现3.6倍加速。其突破性在于具备长程规划、自适应纠错和超长上下文整合能力,在SWE-benchPro测试中超越ClaudeOpus4.6登顶全球第一。这标志着中国开源AI已跻身世界第一梯队,为开

文章图片
#开源#人工智能
开源重磅|智谱GLM-5.1:告别“只会说”,成为能独立干活的全自动AI

GLM-5.1开源大模型突破AI长程任务能力瓶颈,实现了持续8小时以上的独立工程开发能力。该模型在三大硬核测试中表现惊艳:从零构建完整操作系统UI、655次迭代优化向量数据库性能7倍、14小时底层算子优化实现3.6倍加速。其突破性在于具备长程规划、自适应纠错和超长上下文整合能力,在SWE-benchPro测试中超越ClaudeOpus4.6登顶全球第一。这标志着中国开源AI已跻身世界第一梯队,为开

文章图片
#开源#人工智能
到底了