ShayleeYU159 个人主页

@ShayleeYU159

ShayleeYU159

2023-12-26 17:53:16 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

图 3：DeepAgent 框架概览。主推理模型能够自主地发现工具、执行动作，并折叠先前记忆，以结构化记忆重新开始——这一切都在统一的思维过程中完成。DeepAgent 通过 ToolPO 进行端到端训练，这是一种强化学习方法，利用工具模拟器来模拟大规模真实世界的工具 API，并通过精细化的优势归因，对最终任务成功以及中间工具调用的正确性进行奖励。如图 3 所示，DeepAgent 框架的整体架构

#论文阅读 #人工智能

读NeurIPS论文 OWL：面向现实世界任务自动化的通用多智能体辅助优化学习

基于大型语言模型（LLM）的多智能体系统在自动化现实世界任务方面显示出巨大潜力，但。当前的方法存在两个关键缺陷：在应用于新领域时，需要完全重新设计架构并对所有组件进行全面重新训练。我们推出了，这是一个分层的多智能体框架，通过模块化架构将战略规划与专业执行解耦。该架构包括：(i)一个用于的领域无关(ii)一个用于的(iii)具备领域特定工具调用能力的专业。这种解耦在推理和训练阶段都：在推理过程中，W

#学习 #人工智能 #论文阅读

Agentic Memory: A-Mem（NeurIPS Poster）

尽管大语言模型（LLM）智能体能够有效地利用外部工具完成复杂的现实世界任务，但它们仍然需要记忆系统来充分利用历史经验。现有的记忆系统虽然支持基本的存储与检索功能，但在记忆组织层面仍然较为粗糙，尽管近期已有尝试引入图数据库进行改进。此外，这些系统通常采用固定的操作方式和结构，限制了其在不同任务场景下的适应能力。为了解决上述问题，本文提出了一种新颖的、以智能体为中心（agentic）的 LLM 智能体

#人工智能 #论文阅读 #学习

「超详细！！」《学术英语》期末笔记

a.破题关键：找信号词。i. Aim:

#学习

读NeurIPS论文 OWL：面向现实世界任务自动化的通用多智能体辅助优化学习

#学习 #人工智能 #论文阅读

#论文阅读 #人工智能

Agent论文阅读笔记——分层工作记忆管理框架

HIAGENT的核心思想是利用子目标对工作记忆进行分层管理。更具体地说，如图2所示，HIAGENT的流程可描述如下：（1）在生成特定的落地动作（grounded actions）之前，我们先引导大型语言模型（LLM）构建一个子目标gᵢ。每个子目标都是整个任务中的一个里程碑。（2）随后，LLM生成实现该子目标所需的精准动作。（3）当LLM判定某个子目标已完成时，我们会将该子目标对应的“动作-观测”对

#人工智能 #论文阅读

到底了