小白学C++. 个人主页

@apple_50860766

小白学C++.

2023-02-10 17:49:00 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

大模型表示趋同现象：迈向柏拉图式真理最新研究发现，不同AI模型（尤其是深度神经网络）的表示空间正在趋同。论文《The Platonic Representation Hypothesis》指出，随着模型规模扩大和多任务能力增强，它们在数据表示方式上越来越相似，甚至跨模态（如视觉与语言）也表现出对齐趋势。这种趋同现象被比喻为"柏拉图式表示"——模型正逐步逼近一个共享的统计现实模

#人工智能

大模型agent综述：A Survey on Large Language Model based Autonomous Agents

大模型自主agent综述

#语言模型 #人工智能 #自然语言处理

强化学习基础概念介绍

强化学习的训练样本（这里指的是智能体与环境交互产生的数据）没有任何标记，即强化学习的训练样本并不是一开始就给好的“输入-标签对”，而是智能体与环境交互过程中自己收集的经验轨迹。强化学习的训练样本不是“数据集中已有的标签”，而是：智能体在环境中探索时所收集的(状态, 动作, 奖励, 下一个状态)的交互记录。它们是强化学习“自学能力”的体现，智能体通过这些数据不断改进自己的策略。在强化学习中，训练样本

大模型论文：Language Models are Unsupervised Multitask Learners(GPT2)

自然语言处理任务，例如问答、机器翻译、阅读理解和摘要，通常是通过对特定任务的数据集进行监督学习来实现的。我们展示了，语言模型在没有任何显式监督的情况下，仅通过训练一个名为 WebText 的包含数百万网页的新数据集，就开始学会这些任务。当模型以“文档 + 问题”的形式进行输入时，生成的回答在 CoQA 数据集上达到了 55 的 F1 分数 —— 这一成绩相当于或超过了四个基线系统中的三个的表现，而

#语言模型 #人工智能 #自然语言处理

大模型论文：BART

本文提出了 BART，一种用于预训练序列到序列模型（sequence-to-sequence models）的去噪自编码器（denoising autoencoder）。使用任意噪声函数对文本进行扰动（corrupt）；学习一个模型来重建原始文本。BERT（双向编码器）、GPT（左到右的解码器）、许多更近期的预训练方案本文评估了多种噪声策略，发现最优的方案是在原始句子中随机打乱顺序，并使用一种新颖

#算法 #语言模型

大模型论文：Language Models are Few-Shot Learners(GPT3)

我们证明了，扩大语言模型的规模在任务无关的 few-shot 学习任务中极大提升了表现，有时甚至能与此前最先进的微调方法相竞争。具体来说，我们训练了 GPT-3，这是一种具有 1750 亿参数的自回归语言模型，其参数数量是此前任何非稀疏语言模型的 10 倍。我们在 few-shot 设置中对其性能进行了测试。对于所有任务，GPT-3 都是在没有任何梯度更新或微调的情况下使用的，其任务和 few-s

#语言模型 #gpt-3 #人工智能

大模型论文：Improving Language Understanding by Generative Pre-Training

自然语言理解包括各种各样的任务，如文本蕴涵、问题回答、语义相似性评估和文档分类。尽管大量未标记的文本语料库丰富，但用于学习这些特定任务的标记数据很少，这使得判别训练模型难以充分执行。我们证明，通过在不同的未标记文本语料库上对语言模型进行生成式预训练，然后对每个特定任务进行判别性微调，可以实现这些任务的巨大收益。与以前的方法相反，我们在微调期间利用任务感知输入转换来实现有效的传输，同时需要对模型体系

#语言模型

到底了