vlln 个人主页

@weixin_44191845

vlln

2023-09-25 11:32:06 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【文献调研】搜索与学习思想在人工智能研究中的应用

训练后的神经网络则作为学习到的启发式函数或策略，能够指导和增强后续搜索过程的效率和有效性。报告的结构将首先介绍“搜索+学习”的基本原理，然后探讨神经网络在学习搜索启发式方面的应用，接着深入分析这种范式在神经组合优化、规划和机器人技术中的应用，并重点介绍在游戏人工智能领域取得突破性进展的AlphaZero和MuZero算法。未来的研究方向包括开发更具通用性和可扩展性的搜索启发式学习方法，提高神经网络

#人工智能 #深度学习 #学习 +1

【论文解读】DINO: 在DETR的肩膀上，重塑端到端目标检测

DETRpioneeringly地将Transformer引入目标检测，以集合预测（Set Prediction）的方式，实现了这一目标。然而，DETR的“初心虽好”，却也带来了训练收敛缓慢、查询（Query）含义模糊等问题。DINO通过3种创新使得在性能、收敛速度和模型效率上均取得了突破，首次确立了端到端Transformer检测器在主流 benchmarks 上的领先地位。

#目标检测 #目标跟踪 #人工智能 +2

【论文速读】达尔文哥德尔机 (Darwin Gödel Machine): 自进化智能体的开放式演化

本文提出了一种名为的新型人工智能框架，旨在实现 AI 系统的完全自主进化。DGM 结合了哥德尔机 (Gödel Machine) 的理论愿景——即 AI 能够递归地重写自身代码以提升性能——与达尔文进化论的实证方法。与需要形式化证明每一次修改都有益的理论哥德尔机不同，DGM 通过在沙箱环境中进行实证评估 (empirical validation)来验证修改的有效性，并通过开放式探索 (open-

#人工智能 #深度学习

【论文速读】MUSE: 层次记忆和自我反思提升的 Agent

核心结论MUSE (Memory-Utilizing and Self-Evolving) 框架通过引入层级化记忆和自我反思机制，解决了 LLM 智能体在长时序任务中无法从经验中学习的问题。在 TheAgentCompany (TAC) 基准测试中，MUSE 仅使用轻量级的模型，便取得了51.78%的成功率，以20%的相对优势超越了此前由 Claude-3.5 Sonnet 驱动的 SOTA (O

#人工智能 #语言模型 #自然语言处理

【论文速读】Gödel Agent 突破人工设计边界的递归自进化代理框架

这篇论文提出了一种名为的新型智能体框架，其核心在于实现了递归式的自我改进 (Recursive Self-Improvement)。不同于以往依赖固定架构（Hand-Designed）或固定元学习算法（Meta-Learning Optimized）的智能体，Gödel Agent 受 Jürgen Schmidhuber 的 Gödel Machine 启发，具备自我指涉 (Self-Refer

#人工智能 #语言模型 #自然语言处理

【论文速读】SEER: 自引导让 Agent 从经验中学习

提出了一种针对复杂工具调用场景的自引导式上下文学习 (Self-Guided ICL)框架。传统的 RAG 方法通常仅依赖语义相似度来检索示例，这在多步推理和工具链规划中往往失效。SEER 的突破在于将检索维度高维化——不仅看 Query 的语义，还考量轨迹相似度工具链覆盖率和意图对齐。更进一步，它引入了在线经验累积 (Online Experience Accumulation)

#人工智能 #深度学习 #语言模型

【论文速读】InfiAgent: 文件为状态实现Agent无限运行

当前 LLM Agent 的核心瓶颈在于上下文长度与任务复杂度的矛盾。InfiAgent 通过将状态管理从 Prompt 中剥离，提出了一种以文件为中心 (File-Centric)的状态抽象机制，从根本上解决了长时序任务中的上下文无限增长问题。核心结论: 在 DeepResearch 基准测试中，InfiAgent 使得一个仅20B 参数的开源模型，能够在无需特定微调的情况下，达到甚至超越 GP

#语言模型 #人工智能 #自然语言处理 +1

【综述速览】迈向 ASI 的中间态：自进化智能体 (Self-Evolving Agents) 深度解构

本篇速览仅选取了文章的重点部分, 希望更详细了解的请阅读原文. 原文非常详尽.γ†α†, et al. (Princeton, Tsinghua, UIUC, HKU 等联合团队)

#人工智能 #深度学习 #自然语言处理 +1

【论文速读】Reflexion: 让Agents使用语义梯度强化学习

本文提出了一种名为Reflexion的框架，旨在解决大型语言模型 (LLM) 在作为智能体 (Agent) 执行任务时，难以通过传统的强化学习 (RL) 方法进行快速、低成本学习的问题。Reflexion 的本质是将“策略优化” (Policy Optimization) 从参数空间 (Parameter Space) 转移到了上下文空间 (Context Space)。

#语言模型 #深度学习 #人工智能

【论文速读】TRM: Tiny 递归推理网络

通过极简的递归结构实现超越大模型的逻辑推理能力。本文提出了一种名为的架构，旨在解决复杂推理任务（如数独、ARC-AGI）。核心突破：证明了不需要复杂的生物学类比或双网络层级结构，仅使用一个单网络、2层深度的微型模型 (7M参数)，通过递归推理和深度监督，即可在逻辑任务上显著超越等超大模型以及先前的 HRM 模型。关键发现：在数据稀缺且需严密逻辑的场景下，模型参数并非越大越好。“极小网络 + 深度递

#人工智能 #深度学习

共 27 条

请选择