logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【论文精读】InstructGPT:从 GPT-3 到 ChatGPT,中间到底发生了什么?

本文介绍了InstructGPT如何通过人类反馈微调语言模型,使其输出更符合用户意图。核心方法分为三步:首先用人工标注的高质量答案对GPT-3进行监督微调(SFT);然后训练奖励模型(RM),通过人类对多个回答的排序学习偏好;最后使用近端策略优化(PPO)算法,让语言模型根据RM的分数不断优化输出。这种SFT+RM+PPO的范式解决了GPT-3仅追求文本续写而忽视用户真实需求的问题,使模型能更好地

#gpt-3#语言模型#自然语言处理
【论文精读】InstructGPT:从 GPT-3 到 ChatGPT,中间到底发生了什么?

本文介绍了InstructGPT如何通过人类反馈微调语言模型,使其输出更符合用户意图。核心方法分为三步:首先用人工标注的高质量答案对GPT-3进行监督微调(SFT);然后训练奖励模型(RM),通过人类对多个回答的排序学习偏好;最后使用近端策略优化(PPO)算法,让语言模型根据RM的分数不断优化输出。这种SFT+RM+PPO的范式解决了GPT-3仅追求文本续写而忽视用户真实需求的问题,使模型能更好地

#gpt-3#语言模型#自然语言处理
GPT-3论文精读-Language Models are Few-Shot Learners:GPT-3 如何把“大模型”推向 In-Context Learning 时代

摘要 GPT-3论文《Language Models are Few-Shot Learners》开创性地展示了大规模语言模型通过上下文学习(In-Context Learning)的能力。研究表明,当模型参数量达到1750亿时,仅需在prompt中提供任务说明和少量示例(Few-shot),无需微调即可完成多种NLP任务。这种Decoder-only架构的Transformer模型通过单向注意力

文章图片
#语言模型#gpt-3#人工智能
一文搞懂 V2PE:位置编码对视觉模型的影响——论文精度笔记(全)

摘要 V2PE论文提出了一种改进视觉语言模型长上下文能力的新方法。研究发现,现有模型在处理长视频、多页文档等复杂输入时性能下降,主要原因是视觉token的位置编码方式不合理。传统方法对文本和视觉token采用相同的"+1"位置步长,导致视觉部分过快消耗位置预算。V2PE创新性地采用可变步长策略:文本token保持+1步长,视觉token使用更小的可变步长δ(如1/256)。这种方法在不减少toke

文章图片
#计算机视觉#学习
Learning Transferable Visual Models From Natural Language Supervision 精读笔记(全)

CLIP创新性地利用互联网图文对进行训练,通过对比学习将图像和文本映射到同一语义空间。相比传统固定类别的视觉模型,CLIP采用双编码器结构(ResNet/ViT+Transformer)和InfoNCE损失,实现开放词汇的zero-shot分类。关键设计包括特征归一化、温度系数调节和注意力池化等,解决了embedding爆炸等问题。实验表明模型规模扩大能显著提升性能,验证了大规模多模态预训练的可行

文章图片
#人工智能
激活函数解析:神经网络背后的“驱动力”

在神经网络中,每个神经元都会接收来自前一层神经元的输入信号,这些输入信号经过加权和求和后,需要通过激活函数进行处理。激活函数的作用是决定神经元是否应该被激活,从而影响输出值。简单来说,激活函数决定了一个神经元对其输入信号的反应程度。激活函数是神经网络中不可或缺的组成部分,它们让网络能够学习复杂的非线性关系。不同的激活函数具有不同的特点,适用于不同的任务和数据集。在实际应用中,ReLU 和其变种(如

文章图片
#神经网络#人工智能#深度学习
YOLO算法检测模型训练参数大合集!!再也不用看不懂超参啦!

YOLO算法检测模型训练参数大合集!!再也不用看不懂超参啦!

文章图片
#算法#机器学习
Python代码规范!详细说明!

综上,是一些常用的代码风格规范说明。

文章图片
#代码规范
深入理解YOLO系列目标检测头的设定方式

版本检测头结构关键技术优势缺点YOLOv1全连接层(FC)无速度快,设计简单,适合实时检测精度低,定位不准确,小物体检测能力差YOLOv2多卷积层 + passthrough更好的精度,适应不同尺寸物体,改进了小物体检测计算复杂度增加,锚框选择依赖数据YOLOv3多卷积层 + 跨层特征融合多尺度预测,特征金字塔(FPN)多尺度检测,精度更高,尤其是小物体检测计算开销大,推理速度较慢通过YOLOv1

文章图片
#深度学习#计算机视觉#人工智能 +2
机器学习(归一化、去中心化、标准化)

机器学习(归一化、去中心化、标准化)

文章图片
#算法#机器学习
    共 13 条
  • 1
  • 2
  • 请选择