logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ChatGPT做2024高考数学题能得多少分?

chatgpt 做2024高考数学看能的多少分?

文章图片
#人工智能#高考
解决git push报错 fatal: Authentication failed for ‘https://github.com/...‘

本文介绍如何解决git push报错 fatal: Authentication failed for 'https://github.com/...'问题

文章图片
#git#github
如何Step-by-Step蒸馏一个LLM模型?

本文逐步Step-by-Step介绍,如何蒸馏一个LLM模型,并且结合Python代码讲解。

文章图片
#人工智能
Python 无法联网环境如何安装python包

内部环境的服务器有些无法连外网,无法下载一些 python 依赖,而且也没有用 Docker/K8s 这种隔离环境的技术。在这种情况下,Python 无法下载一些包,导致一些代码无法运行。本文介绍在这种背景下,如何安装依赖包。

文章图片
#python#开发语言
OpenCompass 初体验,新手如何跑通第一个模型评测

本文介绍如何跑通第一个 OpenCompass 评测模型!

文章图片
#算法#nlp#自然语言处理 +1
conda 报错 “Failed to establish a new connection: [WinError 10061] 由于目标计算机积极拒绝,无法连接”

解决 conda 报错 “Failed to establish a new connection: [WinError 10061] 由于目标计算机积极拒绝,无法连接”。

文章图片
#conda#python
训练中的数据并行DP详细讲解

本文讲解训练中的数据并行,以及如何更新模型状态。

文章图片
#人工智能#自然语言处理#语言模型
理解LLM所谓的“推理”能力

本文探讨了大语言模型(LLM)的推理能力定义及提升方法。作者将推理定义为处理需要多步骤思考的复杂问题,如数学证明和谜语解答,而非简单的事实性问题。目前提升推理能力主要有四种方法:(1)推理时间扩展技术,如思维链提示和多答案投票;(2)纯强化学习,如DeepSeek-R1-Zero采用的跳过监督微调直接强化训练;(3)结合监督微调和强化学习的标准流程,如DeepSeek-R1;(4)模型蒸馏技术。文

文章图片
#DeepSeek#人工智能
Python 如何优雅编写多进程读取文件代码

Python 如何优雅的多进程读取文件。

文章图片
#python#开发语言
    共 53 条
  • 1
  • 2
  • 3
  • 6
  • 请选择