logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

天工DeepResearchAgent 代码库逻辑结构总结

DeepResearchAgent 是一个深度研究智能体框架,提供了多种智能体实现、工具集成和配置管理功能,支持研究任务的自动化和智能化处理。

#人工智能
AI智能体入门 2)探索 AI 智能体框架

个性化推荐:AI 能分析用户行为与偏好,提供个性化的推荐、内容和体验。✅ 示例:Netflix 使用 AI 根据观影记录推荐电影和剧集,从而提升用户参与度和满意度。自动化与效率提升:AI 可自动执行重复性任务,简化工作流程,提升运营效率。✅ 示例:客户服务应用使用 AI 聊天机器人处理常见问题,降低响应时间,让人工客服专注于复杂事务。增强用户体验:通过语音识别、自然语言处理和预测文本输入等智能功能

#人工智能
工业/服务机器人与具身智能的前景分析

具身智能(Embodied Intelligence)强调智能体通过与物理环境的实时交互来学习和决策,是机器人技术的重要发展方向。在工业机器人和服务机器人领域,具身智能的应用前景差异显著,但均具有颠覆性潜力。具身智能正推动机器人从“自动化工具”向“自主智能体”进化,其应用前景取决于技术、成本与伦理的协同突破。

文章图片
#机器人
Prompt工程论文:ExpeL- 大语言模型智能体是体验式学习者

论文地址:https://ojs.aaai.org/index.php/AAAI/article/download/29936/31635摘要:近期,关于将大型语言模型(LLMs)应用于决策任务的研究兴趣激增,并通过利用LLMs中蕴含的广泛世界知识取得了显著进展。尽管人们对定制LLMs以适应特定决策任务的需求日益增长,但对其进行微调不仅资源消耗巨大,还可能削弱模型的泛化能力。此外,最先进的语言模型

文章图片
#语言模型#人工智能
Prompt工程之LangChain实战:多智能体辩论系统(3)

判断是否调用了工具if tool:🎯目标任务自定义一个返回当前时间的工具(CurrentTimeTool)集成到 DialogueAgentWithTools 中编写提示语,引导模型在需要时调用该工具current_time_tool = Tool(name="current_time", func=current_time_func, description="返回当前系统时间")

文章图片
#python
Prompt工程论文:多智能体链-大语言模型协同处理长上下文任务

论文地址:https://arxiv.org/abs/2406.02818摘要:应对长上下文处理难题已成为大语言模型(LLMs)领域中的关键问题。目前主要有两种常见策略:1)缩短输入长度,例如通过检索增强生成(Retrieval-Augmented Generation, RAG)获取相关片段;2)扩展LLMs的上下文窗口限制。然而,这两种策略各有局限:输入缩减无法保证覆盖所需的关键信息部分,而窗

文章图片
#语言模型#人工智能
Prompt实战之构建基于 LLM 的 BabyAI 智能体系统 4)函数式提示设计、反事实训练与系统优化策略

在本节中,我们将从三个关键方向深入探讨 LLM 智能体的高级设计:将提示(prompt)设计为一个 参数化的函数,输入状态、目标、历史,输出标准格式的文本。这样做的好处是:可进一步扩展为多语言、多风格、多模型版本:技巧提示版本管理:为每个 prompt 函数加版本号,如 ;条件控制:通过参数动态控制是否提供地图、上一步动作等内容;提示压缩:在历史过长时,使用摘要函数缩短 obs_history。4

文章图片
#人工智能#深度学习
Agent-R1框架核心解析:基于Ray的分布式强化学习训练器实现

是Agent-R1框架的核心组件,负责协调分布式训练流程的各个环节。分布式资源管理:通过Ray框架管理GPU资源和工作节点训练流程控制:实现完整的PPO(Proximal Policy Optimization)训练循环数据处理与增强:包括数据加载、批处理和序列长度平衡多模态奖励计算:集成多种奖励模型和自定义奖励函数优势估计:支持多种优势函数计算方法(GAE、GRPO等)模型检查点与恢复:实现训练

#人工智能
StepSearch:用强化学习点燃大模型的多跳搜索能力

StepSearch的成功证明:在复杂推理任务中,“细致入微的过程监督”比“事后诸葛亮式的全局评价”更有效。它不仅为大模型赋予了类似人类的分步信息检索能力,也为构建更可靠、可解释的AI系统提供了新思路。随着技术发展,我们有望看到能像人类研究员一样“提出问题-搜索验证-整合结论”的智能体,在科研、教育等领域发挥变革性作用。(本文代码与数据集已开源:https://github.com/Zillwan

#人工智能
OpenVLA:开源视觉-语言-动作模型的突破性进展

OpenVLA的提出标志着机器人学向“开源基础模型”时代迈进了关键一步。性能突破:以70亿参数超越550亿参数的闭源模型,证明高效架构设计的价值。泛化能力:通过多样化数据和融合视觉编码器,实现跨机器人、跨场景的零样本控制。可访问性:LoRA微调与量化技术使模型能在消费级硬件上部署,降低应用门槛。开源生态:完整工具链推动社区协作,加速通用机器人政策的研究与应用。未来,随着更多研究者参与优化,Open

#人工智能
    共 194 条
  • 1
  • 2
  • 3
  • 20
  • 请选择