logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

​​解码器加速秘籍:KV缓存+Beam Search实现5倍推理性能提升

本文深入解析Transformer模型的训练与推理全流程。训练部分详细介绍了教师强制技术、损失函数选择、Noam学习率调度等关键方法;推理部分对比了贪婪解码、BeamSearch及其优化技术。文章还探讨了KV缓存、批量生成等加速策略,以及BLEU评估、采样解码等进阶技术。在部署优化方面,涵盖模型量化、ONNX导出和TensorRT加速等工业级方案。最后提供了训练调优指南和推理优化策略,强调训练与推

文章图片
#人工智能#pytorch#自然语言处理 +4
AI大模型应用开发工程师底层能力:从感知机到反向传播的数学与代码完全指南

本文是神经网络核心原理的深度技术解析,通过数学推导与完整代码实现相结合的方式,系统拆解从感知机到反向传播的完整知识体系。文章包含七大核心模块:​​感知机原理​​:从生物神经元启发的数学模型,到Python实现AND逻辑门(含局限性分析)​​激活函数详解​​:对比5类函数数学特性与适用场景(含ReLU/Sigmoid可视化实现)​​损失函数设计​​:剖析MSE/交叉熵/Hinge等函数的数学本质与工

文章图片
#人工智能#机器学习#神经网络 +4
到底了