
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了使用openJiuwen agent-core框架开发AI Agent的实践。第一部分通过5分钟构建"Hello World"示例,展示了框架的核心概念和基本工作流程。第二部分进阶开发了一个"毒舌文档排版助理",能够自动提取文本要点并给出尖锐点评。文章详细讲解了从环境配置、组件搭建到工作流连接的全过程,展示了该框架组件化设计、架构清晰的特性,适合快

分析ZLibrary作为数字图书馆平台采用的核心反爬策略,包括IP限制、请求频率控制、验证码机制、动态页面渲染技术等。
本文介绍了通过ClaudeCode实现"Vibe Coding"的编程新范式,即无需打开编辑器即可完成全流程开发。重点分析了ClaudeCode的5大核心功能:升级的Claude 4模型、Subagents分工系统、MCP交互协议、CLAUDE.md规范文件和Skills技能库。作者以紫微斗数命理系统开发为例,展示了如何解决AI训练数据不足和上下文管理两大难题:通过conten

昇腾NPU算子优化解密:突破大模型性能瓶颈 在大模型部署中,昇腾NPU的性能表现不仅取决于硬件算力,更关键的是算子执行效率。达芬奇架构采用计算与存储分离设计,包含Cube Unit、Vector Unit和Unified Buffer(UB)三大核心组件。未优化时,数据在HBM和UB间频繁搬运导致计算单元"饥饿"。 CANN软件栈通过三大技术破解这一困境: 算子融合:将多个小算

本文介绍了在昇腾Atlas 800T NPU上部署Llama-3-8B-Instruct模型构建本地"合成数据工厂"的实践方案。针对高质量数据获取难题,文章详细展示了从硬件环境检查、依赖安装到模型下载的完整流程。通过Prompt Engineering技术,将非结构化文档转化为标准JSON格式的QA训练数据,实现数据不出域的安全处理。该方案解决了模型输出格式不可控和幻觉风险问题

本文介绍了在昇腾(Ascend)NPU平台上部署Meta-Llama-3-8B-Instruct大模型的全过程。首先通过npu-smi命令确认硬件状态,安装必要的Python依赖库后,从ModelScope社区下载模型权重文件。文章详细展示了基础推理测试的实现代码,包括环境配置、模型加载和推理生成等核心模块,并验证了模型在NPU上的运行效果。整个流程涵盖了从环境准备到实际部署的关键步骤,为开发者提

本文详细介绍了在华为昇腾AI平台上部署Llama大模型的完整流程。首先阐述了昇腾平台作为国产化AI解决方案的优势,然后分步骤指导环境配置:包括云端免费算力资源申请(无需物理硬件)和自有硬件部署方案(推荐Atlas 300T Pro训练卡)。软件环境搭建部分提供了代码验证NPU可用性,并安装必要的Python依赖包。重点讲解了Llama-3-8B模型的下载方法(通过ModelScope)和转换为昇腾

本文介绍了仓颉语言生态中的libcrc库开发,该库为数据通信和存储提供高效的CRC校验功能。核心内容包括:1)支持从8位到64位的多种CRC算法变体;2)采用查找表技术大幅提升计算性能;3)实现流式处理和增量更新功能以应对大数据场景;4)针对不同位宽的CRC算法进行类型安全设计。文章详细解析了查找表生成、多算法变体支持、线程安全初始化等关键技术实现,以及解决CRC-24特殊处理等技术挑战的方案,为
本文分享了将DanceGRPO框架迁移至昇腾平台并成功微调FLUX模型的全过程。DanceGRPO作为首个统一视觉生成强化学习框架,通过多图像生成、组内评分和策略优化三阶段提升生成质量。作者详细介绍了环境搭建、分阶段精度对齐策略(包括推理、Reward和训练阶段)以及关键性能优化点(如算子优化、通信调优等)。最终在昇腾平台实现了与GPU相当的生成效果,性能提升达25%。文章还总结了迁移过程中的常见

这个过程重复成千上万次,模型就学会了"什么样的噪声对应什么样的图像"。中间层是加速算法,包括高性能算子(RoPE、RMSNorm、FlashAttention)、并行策略(Ulysses、Ring、CFG)、近似算法(DiTCache、序列压缩)和量化技术(W8A8、FA量化)。扩散模型的火爆让AI视频生成成为了当下最热门的技术方向之一。但当我第一次尝试在昇腾NPU上部署Wan2.1视频生成模型时







