logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【论文解读】Gorilla:连接海量API的大型语言模型

Gorilla 提出了一种通过微调 (fine-tuning) 和检索增强 (retrieval augmentation) 的方法,使 LLM 能够更有效地使用大量 API。构建了一个大规模的、包含真实世界 API 调用及其指令的数据集 (APIBench),并在此数据集上微调一个基础 LLM。

文章图片
#语言模型#人工智能#自然语言处理 +3
【深度好文】Agentic Tool Use RL 原生多轮工具调用训练范式

本文聚焦于单智能体式的**工具使用学习(Agentic Tool Use Learning)**,特别是以强化学习(RL)为核心的端到端范式。我们将系统剖析几项代表性工作,辨其思想,明其得失。我们的讨论**区别于主流基于提示词和软件工程构建的AI Agent**——其依赖大量人工设计的模块,而我们关注的是如何让模型通过与环境交互,**从经验中内生出规划与行动的能力**。

文章图片
#人工智能#神经网络#transformer +1
【论文解读】Toolformer: 语言模型自学使用工具

Toolformer 提出了一种自监督框架,使语言模型能够学会自主使用外部工具。通过以“降低未来词元预测损失”为目标来过滤和学习 API 调用,Toolformer 在不牺牲核心语言能力的前提下,显著增强了模型在知识获取、数学计算、实时信息处理等方面的零样本能力,甚至能让较小模型匹敌数倍于其参数量的更大模型。

文章图片
#语言模型#人工智能#自然语言处理 +2
【论文速读】Reflexion: 让Agents使用语义梯度强化学习

本文提出了一种名为Reflexion的框架,旨在解决大型语言模型 (LLM) 在作为智能体 (Agent) 执行任务时,难以通过传统的强化学习 (RL) 方法进行快速、低成本学习的问题。Reflexion 的本质是将“策略优化” (Policy Optimization) 从参数空间 (Parameter Space) 转移到了上下文空间 (Context Space)。

文章图片
#语言模型#深度学习#人工智能
【论文速读】达尔文哥德尔机 (Darwin Gödel Machine): 自进化智能体的开放式演化

本文提出了一种名为的新型人工智能框架,旨在实现 AI 系统的完全自主进化。DGM 结合了哥德尔机 (Gödel Machine) 的理论愿景——即 AI 能够递归地重写自身代码以提升性能——与达尔文进化论的实证方法。与需要形式化证明每一次修改都有益的理论哥德尔机不同,DGM 通过在沙箱环境中进行实证评估 (empirical validation)来验证修改的有效性,并通过开放式探索 (open-

文章图片
#人工智能#深度学习
【论文速读】ReCAP: 递归上下文感知——解决 LLM 长时序规划迷失的通用框架

核心结论:针对长时序任务(Long-horizon tasks)中 LLM 容易迷失目标或上下文过载的问题,本文提出了一种名为 ReCAP 的递归推理与规划框架。不同于传统的扁平化思考链(CoT/ReAct)或割裂的层级规划,ReCAP 通过共享的滑动窗口上下文和**结构化的父级计划重注入(Re-injection)**机制,在保持高层意图连贯性的同时,实现了对底层执行细节的动态修正。前瞻展望:在

文章图片
#人工智能#语言模型#自然语言处理
【论文速读】InfiAgent: 文件为状态实现Agent无限运行

当前 LLM Agent 的核心瓶颈在于上下文长度与任务复杂度的矛盾。InfiAgent 通过将状态管理从 Prompt 中剥离,提出了一种以文件为中心 (File-Centric)的状态抽象机制,从根本上解决了长时序任务中的上下文无限增长问题。核心结论: 在 DeepResearch 基准测试中,InfiAgent 使得一个仅20B 参数的开源模型,能够在无需特定微调的情况下,达到甚至超越 GP

文章图片
#语言模型#人工智能#自然语言处理 +1
【论文速读】MUSE: 层次记忆和自我反思提升的 Agent

核心结论MUSE (Memory-Utilizing and Self-Evolving) 框架通过引入层级化记忆和自我反思机制,解决了 LLM 智能体在长时序任务中无法从经验中学习的问题。在 TheAgentCompany (TAC) 基准测试中,MUSE 仅使用轻量级的模型,便取得了51.78%的成功率,以20%的相对优势超越了此前由 Claude-3.5 Sonnet 驱动的 SOTA (O

文章图片
#人工智能#语言模型#自然语言处理
【论文速读】SEER: 自引导让 Agent 从经验中学习

提出了一种针对复杂工具调用场景的自引导式上下文学习 (Self-Guided ICL)框架。传统的 RAG 方法通常仅依赖语义相似度来检索示例,这在多步推理和工具链规划中往往失效。SEER 的突破在于将检索维度高维化——不仅看 Query 的语义,还考量轨迹相似度工具链覆盖率和意图对齐。更进一步,它引入了在线经验累积 (Online Experience Accumulation)

文章图片
#人工智能#深度学习#语言模型
【论文速读】Gödel Agent 突破人工设计边界的递归自进化代理框架

这篇论文提出了一种名为的新型智能体框架,其核心在于实现了递归式的自我改进 (Recursive Self-Improvement)。不同于以往依赖固定架构(Hand-Designed)或固定元学习算法(Meta-Learning Optimized)的智能体,Gödel Agent 受 Jürgen Schmidhuber 的 Gödel Machine 启发,具备自我指涉 (Self-Refer

文章图片
#人工智能#语言模型#自然语言处理
    共 41 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择