logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

小红书团队X人大最新论文精读-DeepAgent:一个具备可扩展工具集的通用推理智能体

图 3:DeepAgent 框架概览。主推理模型能够自主地发现工具、执行动作,并折叠先前记忆,以结构化记忆重新开始——这一切都在统一的思维过程中完成。DeepAgent 通过 ToolPO 进行端到端训练,这是一种强化学习方法,利用工具模拟器来模拟大规模真实世界的工具 API,并通过精细化的优势归因,对最终任务成功以及中间工具调用的正确性进行奖励。如图 3 所示,DeepAgent 框架的整体架构

文章图片
#论文阅读#人工智能
读NeurIPS论文 OWL:面向现实世界任务自动化的通用多智能体辅助优化学习

基于大型语言模型(LLM)的多智能体系统在自动化现实世界任务方面显示出巨大潜力,但。当前的方法存在两个关键缺陷:在应用于新领域时,需要完全重新设计架构并对所有组件进行全面重新训练。我们推出了,这是一个分层的多智能体框架,通过模块化架构将战略规划与专业执行解耦。该架构包括:(i)一个用于的领域无关(ii)一个用于的(iii)具备领域特定工具调用能力的专业。这种解耦在推理和训练阶段都:在推理过程中,W

文章图片
#学习#人工智能#论文阅读
Agentic Memory: A-Mem(NeurIPS Poster)

尽管大语言模型(LLM)智能体能够有效地利用外部工具完成复杂的现实世界任务,但它们仍然需要记忆系统来充分利用历史经验。现有的记忆系统虽然支持基本的存储与检索功能,但在记忆组织层面仍然较为粗糙,尽管近期已有尝试引入图数据库进行改进。此外,这些系统通常采用固定的操作方式和结构,限制了其在不同任务场景下的适应能力。为了解决上述问题,本文提出了一种新颖的、以智能体为中心(agentic)的 LLM 智能体

文章图片
#人工智能#论文阅读#学习
「超详细!!」《学术英语》期末笔记

a.破题关键:找信号词。i. Aim:

文章图片
#学习
读NeurIPS论文 OWL:面向现实世界任务自动化的通用多智能体辅助优化学习

基于大型语言模型(LLM)的多智能体系统在自动化现实世界任务方面显示出巨大潜力,但。当前的方法存在两个关键缺陷:在应用于新领域时,需要完全重新设计架构并对所有组件进行全面重新训练。我们推出了,这是一个分层的多智能体框架,通过模块化架构将战略规划与专业执行解耦。该架构包括:(i)一个用于的领域无关(ii)一个用于的(iii)具备领域特定工具调用能力的专业。这种解耦在推理和训练阶段都:在推理过程中,W

文章图片
#学习#人工智能#论文阅读
小红书团队X人大最新论文精读-DeepAgent:一个具备可扩展工具集的通用推理智能体

图 3:DeepAgent 框架概览。主推理模型能够自主地发现工具、执行动作,并折叠先前记忆,以结构化记忆重新开始——这一切都在统一的思维过程中完成。DeepAgent 通过 ToolPO 进行端到端训练,这是一种强化学习方法,利用工具模拟器来模拟大规模真实世界的工具 API,并通过精细化的优势归因,对最终任务成功以及中间工具调用的正确性进行奖励。如图 3 所示,DeepAgent 框架的整体架构

文章图片
#论文阅读#人工智能
Agent论文阅读笔记——分层工作记忆管理框架

HIAGENT的核心思想是利用子目标对工作记忆进行分层管理。更具体地说,如图2所示,HIAGENT的流程可描述如下:(1)在生成特定的落地动作(grounded actions)之前,我们先引导大型语言模型(LLM)构建一个子目标gᵢ。每个子目标都是整个任务中的一个里程碑。(2)随后,LLM生成实现该子目标所需的精准动作。(3)当LLM判定某个子目标已完成时,我们会将该子目标对应的“动作-观测”对

文章图片
#人工智能#论文阅读
到底了