qq_30548401 个人主页

@qq_30548401

qq_30548401

2025-06-10 21:44:27 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

解码器加速秘籍：KV缓存+Beam Search实现5倍推理性能提升

本文深入解析Transformer模型的训练与推理全流程。训练部分详细介绍了教师强制技术、损失函数选择、Noam学习率调度等关键方法；推理部分对比了贪婪解码、BeamSearch及其优化技术。文章还探讨了KV缓存、批量生成等加速策略，以及BLEU评估、采样解码等进阶技术。在部署优化方面，涵盖模型量化、ONNX导出和TensorRT加速等工业级方案。最后提供了训练调优指南和推理优化策略，强调训练与推

#人工智能 #pytorch #自然语言处理 +4

AI大模型应用开发工程师必备：图解偏差-方差/过拟合/交叉验证全解析

避坑指南：机器学习高错误率背后的七大核心概念

#人工智能 #神经网络 #深度学习 +4

AI大模型应用开发工程师底层能力：从感知机到反向传播的数学与代码完全指南

本文是神经网络核心原理的深度技术解析，通过数学推导与完整代码实现相结合的方式，系统拆解从感知机到反向传播的完整知识体系。文章包含七大核心模块：感知机原理：从生物神经元启发的数学模型，到Python实现AND逻辑门（含局限性分析）激活函数详解：对比5类函数数学特性与适用场景（含ReLU/Sigmoid可视化实现）损失函数设计：剖析MSE/交叉熵/Hinge等函数的数学本质与工

#人工智能 #机器学习 #神经网络 +4

到底了