
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
这个过程重复成千上万次,模型就学会了"什么样的噪声对应什么样的图像"。中间层是加速算法,包括高性能算子(RoPE、RMSNorm、FlashAttention)、并行策略(Ulysses、Ring、CFG)、近似算法(DiTCache、序列压缩)和量化技术(W8A8、FA量化)。扩散模型的火爆让AI视频生成成为了当下最热门的技术方向之一。但当我第一次尝试在昇腾NPU上部署Wan2.1视频生成模型时
这个过程重复成千上万次,模型就学会了"什么样的噪声对应什么样的图像"。中间层是加速算法,包括高性能算子(RoPE、RMSNorm、FlashAttention)、并行策略(Ulysses、Ring、CFG)、近似算法(DiTCache、序列压缩)和量化技术(W8A8、FA量化)。扩散模型的火爆让AI视频生成成为了当下最热门的技术方向之一。但当我第一次尝试在昇腾NPU上部署Wan2.1视频生成模型时
这个过程重复成千上万次,模型就学会了"什么样的噪声对应什么样的图像"。中间层是加速算法,包括高性能算子(RoPE、RMSNorm、FlashAttention)、并行策略(Ulysses、Ring、CFG)、近似算法(DiTCache、序列压缩)和量化技术(W8A8、FA量化)。扩散模型的火爆让AI视频生成成为了当下最热门的技术方向之一。但当我第一次尝试在昇腾NPU上部署Wan2.1视频生成模型时
本文分享了将DanceGRPO框架迁移至昇腾平台并成功微调FLUX模型的全过程。DanceGRPO作为首个统一视觉生成强化学习框架,通过多图像生成、组内评分和策略优化三阶段提升生成质量。作者详细介绍了环境搭建、分阶段精度对齐策略(包括推理、Reward和训练阶段)以及关键性能优化点(如算子优化、通信调优等)。最终在昇腾平台实现了与GPU相当的生成效果,性能提升达25%。文章还总结了迁移过程中的常见

本文分享了将DanceGRPO框架迁移至昇腾平台并成功微调FLUX模型的全过程。DanceGRPO作为首个统一视觉生成强化学习框架,通过多图像生成、组内评分和策略优化三阶段提升生成质量。作者详细介绍了环境搭建、分阶段精度对齐策略(包括推理、Reward和训练阶段)以及关键性能优化点(如算子优化、通信调优等)。最终在昇腾平台实现了与GPU相当的生成效果,性能提升达25%。文章还总结了迁移过程中的常见

这篇文章介绍了一个为ClaudeCode设计的根提示词模板CLAUDE.md,该模板由博主赵纯想提炼优化。它构建了一个三层次的认知架构(现象层、本质层、哲学层),将AI角色定位为代码医生、侦探和诗人的三位一体。模板包含代码设计哲学(如简化原则、实用主义)、质量指标(文件规模限制)、代码坏味道检测机制,并强调架构文档CLAUDE.md作为系统记忆的重要性。最终目标是实现从问题修复到设计理解的认知跃迁

谷歌Gemini 3.0 AI模型近日引发热议,仅用几行提示词就能生成功能完整的HTML版MacOS系统界面,所有应用均可操作。该模型还能快速创建视频编辑器、短视频App和文字游戏等。通过DeepSider浏览器插件,用户可免费使用Gemini 3.0及其他主流AI模型(如GPT-5、Claude 4.5等),实现代码生成、文档解析、视频制作等功能。插件支持中文,无需特殊网络,安装后即可体验多模态

本文介绍了在昇腾Atlas 800T NPU上部署Llama-3-8B-Instruct模型构建本地"合成数据工厂"的实践方案。针对高质量数据获取难题,文章详细展示了从硬件环境检查、依赖安装到模型下载的完整流程。通过Prompt Engineering技术,将非结构化文档转化为标准JSON格式的QA训练数据,实现数据不出域的安全处理。该方案解决了模型输出格式不可控和幻觉风险问题

本文介绍了在昇腾Atlas 800T NPU上部署Llama-3-8B-Instruct模型构建本地"合成数据工厂"的实践方案。针对高质量数据获取难题,文章详细展示了从硬件环境检查、依赖安装到模型下载的完整流程。通过Prompt Engineering技术,将非结构化文档转化为标准JSON格式的QA训练数据,实现数据不出域的安全处理。该方案解决了模型输出格式不可控和幻觉风险问题

本文介绍了在昇腾Atlas 800T NPU上部署Llama-3-8B-Instruct模型构建本地"合成数据工厂"的实践方案。针对高质量数据获取难题,文章详细展示了从硬件环境检查、依赖安装到模型下载的完整流程。通过Prompt Engineering技术,将非结构化文档转化为标准JSON格式的QA训练数据,实现数据不出域的安全处理。该方案解决了模型输出格式不可控和幻觉风险问题








