
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
如何Step-by-Step蒸馏一个LLM模型?
本文逐步Step-by-Step介绍,如何蒸馏一个LLM模型,并且结合Python代码讲解。

大语言模型LLM基础扫盲速通版
本文介绍大语言模型LLM的相关基础知识。

量化W8A8和W8A16是什么?
本文介绍量化的w8a8、w8a16的详细内容。

如何定位报错: indexSelectLargeIndex:... Assertion `srcIndex < srcSelectDimSize` fail
本文介绍如何解决报错:indexSelectLargeIndex:... Assertion `srcIndex < srcSelectDimSize` fail

大语言模型LLM基础扫盲速通版
本文介绍大语言模型LLM的相关基础知识。

汇总大语言模型LLM的评测基准数据集(BenchMarks)
本文介绍大语言模型LLM的BenchMarks评测数据集,帮助评估模型能力。

解决git push报错 fatal: Authentication failed for ‘https://github.com/...‘
本文介绍如何解决git push报错 fatal: Authentication failed for 'https://github.com/...'问题

训练中的数据并行DP详细讲解
本文讲解训练中的数据并行,以及如何更新模型状态。

理解LLM所谓的“推理”能力
本文探讨了大语言模型(LLM)的推理能力定义及提升方法。作者将推理定义为处理需要多步骤思考的复杂问题,如数学证明和谜语解答,而非简单的事实性问题。目前提升推理能力主要有四种方法:(1)推理时间扩展技术,如思维链提示和多答案投票;(2)纯强化学习,如DeepSeek-R1-Zero采用的跳过监督微调直接强化训练;(3)结合监督微调和强化学习的标准流程,如DeepSeek-R1;(4)模型蒸馏技术。文

Python 如何优雅编写多进程读取文件代码
Python 如何优雅的多进程读取文件。








