
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文分析了昇腾NPU在Llama2-7B模型推理过程中算子融合的优化效果。通过将Transformer层的11个独立kernel融合为2-3个主要kernel(QKV+RotaryEmbedding融合、FlashAttention融合、FFN融合),显著减少了68%的显存读写量(从121.6GB降至38.4GB)。文章详细拆解了单层Transformer的算子调用链,对比了融合前后的计算流程差异

本文分析了昇腾NPU在Llama2-7B模型推理过程中算子融合的优化效果。通过将Transformer层的11个独立kernel融合为2-3个主要kernel(QKV+RotaryEmbedding融合、FlashAttention融合、FFN融合),显著减少了68%的显存读写量(从121.6GB降至38.4GB)。文章详细拆解了单层Transformer的算子调用链,对比了融合前后的计算流程差异

本文分析了昇腾NPU在Llama2-7B模型推理过程中算子融合的优化效果。通过将Transformer层的11个独立kernel融合为2-3个主要kernel(QKV+RotaryEmbedding融合、FlashAttention融合、FFN融合),显著减少了68%的显存读写量(从121.6GB降至38.4GB)。文章详细拆解了单层Transformer的算子调用链,对比了融合前后的计算流程差异

本文深入解析Flutter在OpenHarmony平台上的数据持久化与查询技术,重点介绍了JSON文件存储方案。主要内容包括:1)数据持久化概念及移动端存储方案对比;2)文件操作详解,涵盖path_provider插件使用、File API基础操作和完整数据保存实现;3)JSON序列化原理,包括Dart中的JSON处理、对象序列化实现及批量序列化方法。通过本文,开发者可掌握在Flutter应用中高

本文介绍了使用Flutter for OpenHarmony开发数独游戏的完整流程。主要内容包括:数独游戏规则与功能规划、数据模型设计、回溯算法生成数独谜题、难度分级实现等关键技术。通过Flutter框架实现了数独生成、冲突检测、提示系统等核心功能,并详细讲解了回溯算法在数独生成中的应用。该项目展示了Flutter在逻辑类游戏开发中的优势,为开发者提供了完整的跨平台游戏开发参考。

摘要 本文详细介绍了使用Flutter for OpenHarmony框架开发数学题目生成系统的完整过程。系统支持8种不同题型,包括10/20/100以内的加减乘除运算,每种题型都实现了特定的约束条件处理。文章涵盖了项目架构设计、数据模型构建、UI界面实现等关键环节,重点讲解了随机题目生成算法、答题界面设计、评卷系统等核心技术实现。通过ChoiceChip组件实现题型选择,ListView展示题目

摘要 本文详细介绍了使用Flutter for OpenHarmony开发跳一跳游戏的完整过程。游戏核心功能包括蓄力机制、物理模拟、平台随机生成和碰撞检测。通过CustomPainter实现游戏绘图,Timer实现蓄力计时和物理更新。文章涵盖数据模型设计(玩家、平台类)、蓄力系统实现(开始蓄力、释放跳跃)、物理模拟(重力、跳跃轨迹计算)、平台生成(随机位置大小)等关键技术点。游戏还包含分数统计、最

摘要 本文详细介绍使用Flutter for OpenHarmony开发局域网聊天系统的完整流程。系统包含消息发送接收、在线用户管理、状态切换等核心功能,采用StatefulWidget进行状态管理。文章重点讲解了消息气泡UI设计、消息列表管理、实时UI更新等关键技术实现,包括ChatMessage数据模型定义、消息左右对齐显示、系统消息处理等。通过模拟接收消息功能,完整演示了聊天应用的开发过程,

模型压缩是指通过一系列技术手段减少模型的大小和计算量,同时尽可能保持模型的精度。CANN为模型压缩与加速提供了完整的解决方案,从量化到剪枝,从知识蒸馏到低秩分解,都可以高效实现。通过合理的压缩策略,可以在保证精度的前提下大幅提升推理效率。量化降低精度剪枝移除冗余知识蒸馏传递知识低秩分解减少参数层融合优化计算。
Flutter for OpenHarmony Socket通信与消息传输解析 摘要:本文深入探讨Flutter在OpenHarmony平台上的Socket通信技术,实现局域网聊天系统。文章涵盖服务器端设计与客户端实现,包括: Socket通信基础:讲解P2P架构、广播/点对点通信模式及消息类型 服务器端实现:详细解析服务器启动、客户端连接处理、消息广播等核心功能 客户端设计:展示连接服务器、消息








