
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
提出的STAgent模型,通过稳定的工具环境、高质量数据构建和级联训练配方,显著提升了在复杂时空场景中的推理和任务规划能力。实验结果表明,STAgent在领域特定任务和通用任务上均表现出色,展示了其在实际应用中的潜力。该研究不仅为时空智能提供了一个稳健的解决方案,还为其他复杂、开放式的现实世界环境中开发专用代理提供了一种可扩展且有效的方法。- 面向真实时空场景(地图 / 出行 / POI / 路线

一、智能旅行助手需求需求:个性化的旅行规划制定,需要在网上搜索景点信息,对比不同的攻略,查看天气预报,预订酒店,计算预算,规划路线。这个智能旅行助手项目的功能如下:(1)智能行程规划:用户输入目的地、日期、偏好等信息,系统自动生成包含景点、餐饮、酒店的完整行程计划。(2)地图可视化:在地图上标注景点位置、绘制游览路线,让行程一目了然。(3)预算计算:自动计算门票、酒店、餐饮、交通费用,显示预算明细

这篇论文提出的ACE框架通过生成、反射和整理的结构化工作流程,有效地解决了简洁偏差和上下文坍塌问题。ACE在代理和特定领域基准测试中均表现出色,显著提高了模型性能,同时降低了适应延迟和成本。ACE的成功展示了全面、不断发展的上下文在构建可扩展、高效和自改进的LLM系统中的潜力。- 当前主流 prompt / memory / reflection 方法的两个系统性缺陷:- Brevity Bias

传统 KD:教师模型生成一些训练输出,生模型模仿这些输出。GKD(广义 KD):学生模型先自己生成一些序列,然后用教师模型对这些学生生成的序列进行打分或提供反馈,学生模型基于这些反馈进一步调整自己。这可以更好解决“训练时只学教师输出,而测试时要靠自己生成输出”之间的分布不一致问题。GKD = 用 teacher 的“软分布”监督 student,但 teacher 的数据来源可以混合,一部分来自真

AutoGen 将复杂的协作抽象为一场由多角色参与的、可自动进行的“群聊”,其核心在于“以对话驱动协作”。AgentScope 则着眼于工业级应用的健壮性与可扩展性,为构建高并发、分布式的多智能体系统提供了坚实的工程基础。CAMEL 以其轻量级的“角色扮演”和“引导性提示”范式,展示了如何用最少的代码激发两个专家智能体之间深度、自主的协作。LangGraph 则回归到更底层的“状态机”模型,通过显

7种智能体(Agent)协作模式并行模式(Parallel):每个智能体负责处理不同的子任务,例如数据提取、网页检索和内容摘要,它们的输出会整合为一个统一结果。该模式非常适合在文档解析、API 编排等高通量流程中降低延迟;串行模式(Sequential):每个智能体逐步为任务增值,例如一个智能体生成代码、另一个进行审核、第三个负责部署。在工作流自动化、ETL(抽取 - 转换 - 加载)链路以及多步

DSA 训练的两个阶段阶段一:Dense Warm-up先冻住主模型,只训练 Lightning Indexer训练目标是让 Indexer 的输出分布对齐主注意力的分布只训练了 1000 步,共 2.1B tokens阶段二:Sparse Training放开所有参数,让模型适应稀疏注意力模式继续用 KL 散度对齐 Indexer 和主注意力训练了 15000 步,共 943.7B tokens

选对工具,谋定而后动• 新手和老手选择不同:如果你是编程新手,可以从 Replit 或 Lovable 这类可视化工具入手,它们能让你快速搭建界面。但文章指出,当你需要更精细地控制后端逻辑时,这类工具可能力不从心。如果你有基础,那么像 Cursor 或 Claude Code 这类更专业的编码AI工具会是更好的选择,它们提供更精准的控制。• 别直接写代码,先做计划:这是最重要的建议之一。不要一上来

deepseed新发布了一个训练方式autoTP,deepseed就是玩zero的,zero是一种配合DP省显存的方式:- zero1是优化器被打散,- zero2是梯度,- zero3直接是模型参数,如果手里卡有限,显存不够,一般是采用==FSDP+zero3==来训练才能装下比较大的模型,但是zero3因为能拆的都拆了,所以一通信就all2all,计算全被通信吃了,MFU就非常小,虽然是DP但

AgentCLUE-General借鉴了GAIA基准(https://huggingface.co/spaces/gaia-benchmark/leaderboard)对难度等级的定义,来定义难度等级:- 1 级问题通常只考察一个任务场景,解题所需要的步骤不超过 5 个。- 2 级问题通常只考察一个任务场景,解题需要 5 个以上的步骤(通常是6-10个)。如果是考察多个任务场景的“多场景组合”任务








