plmkiomn 个人主页

@plmkiomn

plmkiomn

2025-10-31 16:50:47 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

InstructGPT论文阅读笔记

这篇论文证明了RLHF是比单纯扩大数据规模或在公开 NLP 数据集上微调更有效的对齐手段。它让模型变得更“聪明”、更“诚实”，但也揭示了对齐过程中的复杂性（如毒性与顺从性的平衡）。这也是为什么后来 ChatGPT 能够横空出世的技术基础。

项目实战：Minimind复现——从0训练一个64M小型GPT

大语言模型（Large Language Model, LLM）的出现，引发了全球范围内对 AI 的空前关注。无论是 ChatGPT、DeepSeek 还是 Qwen，都以惊艳的效果让人真切感受到这场技术浪潮的冲击力。然而，动辄数百亿参数的模型规模，使得它们对个人设备而言不仅难以训练，甚至连部署都显得遥不可及。打开大模型的“黑盒子”，真正去理解其内部运作机制，本应是一件令人心潮澎湃的事。遗憾的是，

文章图片

#python #语言模型

InstructGPT论文阅读笔记

这篇论文证明了RLHF是比单纯扩大数据规模或在公开 NLP 数据集上微调更有效的对齐手段。它让模型变得更“聪明”、更“诚实”，但也揭示了对齐过程中的复杂性（如毒性与顺从性的平衡）。这也是为什么后来 ChatGPT 能够横空出世的技术基础。

InstructGPT论文阅读笔记

这篇论文证明了RLHF是比单纯扩大数据规模或在公开 NLP 数据集上微调更有效的对齐手段。它让模型变得更“聪明”、更“诚实”，但也揭示了对齐过程中的复杂性（如毒性与顺从性的平衡）。这也是为什么后来 ChatGPT 能够横空出世的技术基础。

项目实战：Minimind复现——从0训练一个64M小型GPT

大语言模型（Large Language Model, LLM）的出现，引发了全球范围内对 AI 的空前关注。无论是 ChatGPT、DeepSeek 还是 Qwen，都以惊艳的效果让人真切感受到这场技术浪潮的冲击力。然而，动辄数百亿参数的模型规模，使得它们对个人设备而言不仅难以训练，甚至连部署都显得遥不可及。打开大模型的“黑盒子”，真正去理解其内部运作机制，本应是一件令人心潮澎湃的事。遗憾的是，

文章图片

#python #语言模型

项目实战：Minimind复现——从0训练一个64M小型GPT

大语言模型（Large Language Model, LLM）的出现，引发了全球范围内对 AI 的空前关注。无论是 ChatGPT、DeepSeek 还是 Qwen，都以惊艳的效果让人真切感受到这场技术浪潮的冲击力。然而，动辄数百亿参数的模型规模，使得它们对个人设备而言不仅难以训练，甚至连部署都显得遥不可及。打开大模型的“黑盒子”，真正去理解其内部运作机制，本应是一件令人心潮澎湃的事。遗憾的是，

文章图片

#python #语言模型

到底了