logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ClaudeCode / Codex能力增强与团队多Agent协作实战指南

摘要:Claude Code/Codex扩展架构与必装组件指南 本文系统介绍了Claude Code/Codex的五层扩展架构,包括Skills、Plugins、Hooks、MCP和Subagents的层级关系与协作机制。重点推荐了三类必装Skills:1) Karpathy Skills(解决LLM三大通病的行为准则);2) Superpowers(结构化开发方法论);3) Grill Me(设

AI Coding 个人知识库工具深度对比分析

本文对比分析了三款AI知识管理工具:Claude-Obsidian、CodeGraph和Understand-Anything。Claude-Obsidian是基于Obsidian的知识管理Wiki引擎,通过LLM提取实体概念并构建知识库;CodeGraph是为AI Agent设计的代码语义索引图,采用SQLite数据库存储代码知识图谱;Understand-Anything则是多Agent协作的

#人工智能
QwenPaw调研分析

这是最推荐的方式。# SKILL.md 示例:全栈开发助手---description: 全栈开发助手,支持需求分析、代码生成、测试编写、代码审查---## 角色定义你是一位资深全栈开发工程师,精通 Python、TypeScript、React、FastAPI。## 工作流程### 1. 需求分析阶段- 收到用户需求后,先确认技术栈和约束条件- 输出简短的技术方案(不超过5条要点)- 等待用户确

AI Native 调研报告

AI Native:下一代产品与组织的范式革命 AI Native是指从设计之初就以AI为核心构建的产品、公司或组织,其本质特征在于AI的不可移除性——若剥离AI,整个系统将失去存在意义。与AI增强型产品不同,AI Native产品(如Cursor编辑器、Perplexity)以自然语言交互为核心,具备持续学习能力和Agent驱动的动态业务流程。 研究表明,简单叠加AI工具可能降低19%效率,而真

#人工智能
Agent记忆开源项目调研

AgentMemory:专为编码Agent设计的记忆引擎 摘要:AgentMemory是一个开源的持久记忆服务,专为Claude Code、Codex CLI等编码Agent设计,解决跨会话记忆丢失问题。核心特点包括: 自动捕获:通过12个Claude hooks和53个MCP工具静默记录编码过程 智能检索:BM25+Vector+Graph三流融合,召回率达95.2% 多层架构:工作记忆→情景记

#开源
Loop Engineering 深度分析报告

文章摘要 《Loop Engineering:AI Agent自循环系统的设计与实践》介绍了构建AI自主闭环系统的关键方法。报告分为五章: 概念介绍:Loop Engineering通过自动化系统让AI自主执行任务,而非人工提示。它经历了Prompt→Context→Loop的三层抽象跃迁,核心在于循环内嵌具备判断力的Agent。 核心设计:循环六要素包括触发、上下文、行动、验证、状态和重试/终止

#人工智能#大数据
Harness Engineering 最佳实践报告

文章摘要: Harness Engineering(缰绳工程)是为AI Agent构建的"脚手架"工程,通过上下文管理、工具接口、验证循环、记忆系统和安全沙箱,将Agent从"能聊天"提升为"能可靠执行任务"。其核心公式为Agent可靠性=模型智能×Harness质量,实践表明强Harness搭配弱模型的效果可媲美弱Harness加顶级模型,且成本降低20倍。 Harness包含五大要素: 上下文

AI Agent 可观测方案调研报告

本文探讨了AI Agent应用可观测性的核心问题与解决方案,主要内容包括: 背景与痛点:AI应用具有不确定性、高Token成本和难以评估质量等特点,传统的调试方法失效,亟需建立可观测系统。 关键指标:提出AI应用的"黄金三指标" - Token消耗(成本)、Error率(质量)和Duration(性能),特别强调TTFT和TPOT等性能指标。 解决方案:介绍了基于OpenTelemetry标准的端

#人工智能
AI Agent 评测方案

本文系统介绍了AI Agent评测的方法论与实践框架。文章首先阐述了评测的必要性,指出评测可量化Agent性能、确保功能稳定并支持版本对比。核心内容包括: 评测层次划分:能力评测、回归评测和A/B对比 评测三要素:任务(Task)、评分器(Scorer)和评测框架(Harness) 任务设计方法:从真实场景出发,采用结构化Spec设计(FR/EC/SC) 评分体系:组合使用确定性评分器、LLM评分

#人工智能
AI Agent 评测方案

本文系统介绍了AI Agent评测的方法论与实践框架。文章首先阐述了评测的必要性,指出评测可量化Agent性能、确保功能稳定并支持版本对比。核心内容包括: 评测层次划分:能力评测、回归评测和A/B对比 评测三要素:任务(Task)、评分器(Scorer)和评测框架(Harness) 任务设计方法:从真实场景出发,采用结构化Spec设计(FR/EC/SC) 评分体系:组合使用确定性评分器、LLM评分

#人工智能
    共 30 条
  • 1
  • 2
  • 3
  • 请选择