logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

InstructGPT论文阅读笔记

这篇论文证明了RLHF是比单纯扩大数据规模或在公开 NLP 数据集上微调更有效的对齐手段。它让模型变得更“聪明”、更“诚实”,但也揭示了对齐过程中的复杂性(如毒性与顺从性的平衡)。这也是为什么后来 ChatGPT 能够横空出世的技术基础。

#论文阅读
InstructGPT论文阅读笔记

这篇论文证明了RLHF是比单纯扩大数据规模或在公开 NLP 数据集上微调更有效的对齐手段。它让模型变得更“聪明”、更“诚实”,但也揭示了对齐过程中的复杂性(如毒性与顺从性的平衡)。这也是为什么后来 ChatGPT 能够横空出世的技术基础。

#论文阅读
项目实战:Minimind复现——从0训练一个64M小型GPT

大语言模型(Large Language Model, LLM)的出现,引发了全球范围内对 AI 的空前关注。无论是 ChatGPT、DeepSeek 还是 Qwen,都以惊艳的效果让人真切感受到这场技术浪潮的冲击力。然而,动辄数百亿参数的模型规模,使得它们对个人设备而言不仅难以训练,甚至连部署都显得遥不可及。打开大模型的“黑盒子”,真正去理解其内部运作机制,本应是一件令人心潮澎湃的事。遗憾的是,

文章图片
#python#语言模型
项目实战:Minimind复现——从0训练一个64M小型GPT

大语言模型(Large Language Model, LLM)的出现,引发了全球范围内对 AI 的空前关注。无论是 ChatGPT、DeepSeek 还是 Qwen,都以惊艳的效果让人真切感受到这场技术浪潮的冲击力。然而,动辄数百亿参数的模型规模,使得它们对个人设备而言不仅难以训练,甚至连部署都显得遥不可及。打开大模型的“黑盒子”,真正去理解其内部运作机制,本应是一件令人心潮澎湃的事。遗憾的是,

文章图片
#python#语言模型
到底了