晚烛个人主页

@2501_94390157

晚烛

2025-11-24 18:14:37 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

CANN 模型蒸馏实战：大模型知识迁移到小模型

知识蒸馏是一种通过大模型（Teacher）指导小模型（Student）训练的技术。其核心思想是利用Teacher输出的"软标签"（包含类间关系等丰富信息）而非硬标签来训练Student。蒸馏损失函数结合KL散度（软标签）和交叉熵（硬标签），通过温度参数T控制软标签平滑度：T值越大，分布越平滑。实验表明T=3-5适用于多数场景。昇腾平台实现中，Teacher模型冻结，Student通过优化总损失（α

#矩阵 #线性代数 #python

CANN 大模型推理优化实战：FlashAttention、推测解码与连续批处理的工程实现

FlashAttention通过分块计算和在线Softmax技术，将注意力计算的显存占用从O(N²)降至O(N)，同时减少HBM访问次数，实现2.4倍加速。推测解码则利用小模型快速生成候选token，大模型并行验证，打破自回归推理的串行瓶颈，可提升3倍生成速度。两种技术均保持与原方法一致的输出质量，仅需替换实现即可获得显著性能提升。