Ly大可爱个人主页

@weixin_45785795

Ly大可爱

2023-03-29 20:23:59 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

大型语言模型是具有人类水平的提示工程师（ICLR2023）

这是因为指令通常在段落的开头，而“前向”模型只从左到右生成文本，这要求指令在提示的末尾进行预测。为了解决这个问题，我们考虑“反向”模式生成，它使用具有填充功能的LLM，例如T5，GLM和InsertGPT，来推断缺失的指令。例如，在本文的TruthfulQA实验中，作者从原始数据集中使用人工设计的指令开始，并要求“反向”模型提出初始指令样本，以适应缺失的上下文。2）虽然LLMs可以执行广泛范围的自

#语言模型 #人工智能 #自然语言处理

大型语言模型是具有人类水平的提示工程师（ICLR2023）

#语言模型 #人工智能 #自然语言处理

大型语言模型是具有人类水平的提示工程师（ICLR2023）

#语言模型 #人工智能 #自然语言处理

大模型增强大模型：通过融合扩展能力（Google DeepMind2024）

给定一个锚定模型 mB 和一个增强模型 mA，CALM的目标是将这两个模型（mA⊕B）组合起来，以实现作为两个单独模型能力的组合的新能力。具有以下假设：i）我们可以访问 mB 和 mA 的权重，运行前向和反向传播，并访问它们的中间表示；ii）不允许更改两个模型的权重；iii）我们无法访问基础模型的训练数据、超参数和训练状态；iv）我们提供了一些来自目标组合领域的示例。

#人工智能 #语言模型 #自然语言处理

提示的艺术：基于类型特定提示的事件检测（ACL2023）

1）监督事件检测：遵循传统的监督事件检测设置，其中训练、验证和评估数据集涵盖相同的事件类型集。目标是学习一个模型 f，以识别和分类目标事件类型的事件提及。

#人工智能 #自然语言处理

到底了