logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

如何Step-by-Step蒸馏一个LLM模型?

本文逐步Step-by-Step介绍,如何蒸馏一个LLM模型,并且结合Python代码讲解。

文章图片
#人工智能
大语言模型LLM基础扫盲速通版

本文介绍大语言模型LLM的相关基础知识。

文章图片
#语言模型#人工智能#自然语言处理
量化W8A8和W8A16是什么?

本文介绍量化的w8a8、w8a16的详细内容。

文章图片
#人工智能
如何定位报错: indexSelectLargeIndex:... Assertion `srcIndex < srcSelectDimSize` fail

本文介绍如何解决报错:indexSelectLargeIndex:... Assertion `srcIndex < srcSelectDimSize` fail

文章图片
#python#transformer#pytorch +1
大语言模型LLM基础扫盲速通版

本文介绍大语言模型LLM的相关基础知识。

文章图片
#语言模型#人工智能#自然语言处理
汇总大语言模型LLM的评测基准数据集(BenchMarks)

本文介绍大语言模型LLM的BenchMarks评测数据集,帮助评估模型能力。

文章图片
#语言模型#人工智能#自然语言处理
解决git push报错 fatal: Authentication failed for ‘https://github.com/...‘

本文介绍如何解决git push报错 fatal: Authentication failed for 'https://github.com/...'问题

文章图片
#git#github
训练中的数据并行DP详细讲解

本文讲解训练中的数据并行,以及如何更新模型状态。

文章图片
#人工智能#自然语言处理#语言模型
理解LLM所谓的“推理”能力

本文探讨了大语言模型(LLM)的推理能力定义及提升方法。作者将推理定义为处理需要多步骤思考的复杂问题,如数学证明和谜语解答,而非简单的事实性问题。目前提升推理能力主要有四种方法:(1)推理时间扩展技术,如思维链提示和多答案投票;(2)纯强化学习,如DeepSeek-R1-Zero采用的跳过监督微调直接强化训练;(3)结合监督微调和强化学习的标准流程,如DeepSeek-R1;(4)模型蒸馏技术。文

文章图片
#DeepSeek#人工智能
Python 如何优雅编写多进程读取文件代码

Python 如何优雅的多进程读取文件。

文章图片
#python#开发语言
    共 33 条
  • 1
  • 2
  • 3
  • 4
  • 请选择