logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Artificial Analysis - 模型评测与分析平台

Artificial Analysis是全球领先的独立AI评测平台,专注于提供客观的模型基准测试服务。平台已评测474+语言模型和50+API提供商,覆盖语言、图像、视频等多模态领域。其核心Intelligence Index v4.0整合10个高难度评测基准,综合评估模型性能。特色功能包括个性化推荐、多维度对比工具和竞技场盲测模式。平台采用独立第三方评测方法,保障数据透明公正,为开发者、企业和研

#人工智能
GAIA(General AI Assistants Benchmark)

GAIA基准测试评估AI助手在真实场景中的综合能力,包含基础(单步任务)、中级(多工具协同)和高级(开放式规划)三个难度层级。测试用例强调多模态处理(文本/图像/音频)、强制工具调用(搜索/API/代码)和标准化答案设计,避免预训练记忆干扰。与传统基准相比,GAIA更关注现实任务(如医疗诊断)而非抽象推理,并支持动态难度调整。该基准包含466个结构化问题,为评估通用AI提供更贴近实际应用的测试框架

#人工智能
langchain deepagents 框架使用带脚本的Skill

带脚本文件的 Skill 系统实践指南 本文以 arXiv 论文搜索为例,展示了在 deepagents 框架中实现带脚本文件的 Skill 技能系统。该系统由三部分组成:技能描述文件(SKILL.md)、执行脚本(arxiv_search.py)和 Python 脚本执行工具。Agent 通过读取技能描述,调用工具执行 Python 脚本来完成任务。 关键原理 SKILL.md 包含 YAML

LangChain V1 create_agent 与 DeepAgents create_deep_agent 对比学习

LangChain Agent 与 Deep Agent 深度解析 LangChain的create_agent提供基础框架,支持工具循环和结构化输出,而create_deep_agent在此基础上预置了企业级功能,包括默认模型、8个内置中间件、子代理系统等。两者工具调用流程相同,但Middleware方式提供更灵活的动态能力。Deep Agent通过后端抽象层实现开发/生产环境切换,其Middl

LangChain DeepAgent 多 Agent 架构原理学习

DeepAgent 多 Agent 架构设计摘要 DeepAgent 框架采用主从式多 Agent 协作架构,通过 SubAgentMiddleware 实现任务分发与结果汇总。核心特性包括: 两级架构:主 Agent 负责任务路由,子 Agent 执行具体任务 两种子 Agent: SubAgent:声明式配置,框架自动构建 CompiledSubAgent:预编译对象,直接使用 状态隔离:通过

#架构
LangChain DeepAgent 多 Agent 架构原理学习

DeepAgent 多 Agent 架构设计摘要 DeepAgent 框架采用主从式多 Agent 协作架构,通过 SubAgentMiddleware 实现任务分发与结果汇总。核心特性包括: 两级架构:主 Agent 负责任务路由,子 Agent 执行具体任务 两种子 Agent: SubAgent:声明式配置,框架自动构建 CompiledSubAgent:预编译对象,直接使用 状态隔离:通过

#架构
OpenCode中Agent开发模式

OpenCode Agents 指南摘要:本文系统介绍了 OpenCode 中的 AI 代理系统,涵盖核心概念、代理类型(主代理/子代理/系统代理)及配置方法(Markdown/JSON)。重点分析了内置代理(Build/Plan)和专业子代理(General/Explore)的特性与适用场景,详细阐述了三种典型工作流模式(规划→构建循环/多代理协作/专业任务委派)。指南还提供了代理配置深度解析(

OpenCode入门使用学习总结

OpenCode是一款开源的多提供商AI编程助手,通过四大核心架构实现灵活高效的开发体验:1)Zen模型路由器提供75+个AI模型的统一访问和透明计费;2)终端优先的TUI界面支持文件引用、Shell集成和实时成本显示;3)可定制的AI代理系统包含构建、计划等专业角色;4)OpenCode技能实现工作流自动化。相比传统工具,OpenCode提供更灵活的模型选择、按需付费模式和高度可定制性,特别适合

学习Harness Engineering 概念与实践经验

摘要: Harness Engineering 是AI Agent时代的工程范式革命,核心是"人类掌舵,智能体执行"。它通过三大支柱——上下文工程(Context Engineering)、架构约束(Architectural Constraints)和熵管理(Entropy Management)——构建系统化的约束框架,引导AI Agent自主工作。工程师角色从编码者转变为

#人工智能
langchain deepagents 框架使用带脚本的Skill

带脚本文件的 Skill 系统实践指南 本文以 arXiv 论文搜索为例,展示了在 deepagents 框架中实现带脚本文件的 Skill 技能系统。该系统由三部分组成:技能描述文件(SKILL.md)、执行脚本(arxiv_search.py)和 Python 脚本执行工具。Agent 通过读取技能描述,调用工具执行 Python 脚本来完成任务。 关键原理 SKILL.md 包含 YAML

    共 62 条
  • 1
  • 2
  • 3
  • 7
  • 请选择