
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
论文阅读笔记:Training Language Models to Follow Instructions with Human Feedback
论文信息: Ouyang et al., OpenAI, 2022 (arXiv: 2203.02155v1)大语言模型(LLM)的训练目标是"预测互联网文本中的下一个token",这与用户真正想要的——"有帮助地、安全地遵循指令"——之间存在根本性的错位(misalignment)。具体表现为模型可能编造事实、生成有偏见或有害的内容、或者根本不遵循用户指令。作者将这种现象称为语言建模目标的 目标
《Attention Is All You Need》读书报告
论文标题:Attention Is All You Need作者团队:Ashish Vaswani, Llion Jones, Noam Shazeer 等(主要来自 Google Brain 和 Google Research)发表时间:2017年(NIPS 2017)核心贡献:提出了一种全新的、完全基于注意力机制(Attention Mechanism)的网络架构——Transformer,彻
到底了







