logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

长周期 AI Agent 的高效 Harness 设计 —— Anthropic 工程实践深度解析

失败模式解决方案Agent 尝试一次性完成整个应用功能列表 + 增量式进展(一次一个功能)后续 Agent 过早宣布完成功能列表明确标记完成状态会话之间丢失上下文claude-progress.txt + git 日志代码状态混乱描述性 commit + 进度摘要测试不充分浏览器自动化 + 端到端测试无法快速恢复工作状态init.sh + 基础测试流程有效的 Agent 系统设计需要从人类工程实践

#人工智能
llamaindex实战-ChatEngine-Context(上下文)模式

通过对历史消息的缓存,这样可以得到上下文相关的一些信息,可以让大模型的回答更加准确。当然,我认为不能完全依赖这个缓存机制,毕竟这个机制能够缓存的数据是有限的,而且查找相关的上下文内容,也可能有误差。

#人工智能
llamaindex实战-Workflow-实现分支逻辑(本地部署)

工作流(workflow)的一个关键特征是它们支持分支和循环逻辑,比基于图形的方法更简单、更灵活。本文实现了一个工作流,该工作流会根据工作流结点的结果值来判断和选择要执行的后续工作流结点。从而能够更好的控制工作的执行过程,实现更加强大的业务逻辑。

文章图片
#人工智能
llamaindex实战-Workflow-维护事件状态(本地部署)

可以通过一个全局状态,来保留任意数据或函数以供所有事件处理程序使用。

#人工智能
llamaindex实战-Agent-在Agent中和数据库对话(本地部署)

本文实现了一个简单的智能Agent,该Agent先从数据库中查询出数据,然后再通过工具函数来对数据进行处理。这是一个非常常见的场景。从这个场景可以扩展到多个实际的场景。

文章图片
#人工智能
LLM CLI:终端原生的人工智能工作流革命

LLM 是一个命令行工具和 Python 库,用于与各种大型语言模型(LLM)进行交互。OpenAI(GPT-4o、GPT-4o-mini 等)系列系列Meta Llama系列数十种其他模型(通过插件系统)本地运行的模型(通过 Ollama、llama.cpp 等)✅开源透明:完全开源,无黑盒操作✅本地优先:支持完全本地运行的模型✅终端原生:完美融入 Unix 工作流✅可扩展性:强大的插件系统✅数

#人工智能
llamaindex实战-使用deepseek大模型进行本地中文问答

本文使用deepseek大模型来进行本地中文问答。另外,嵌入模型使用中文嵌入模型:dmeta-embedding-zh。由于我只有16C64G的CPU配置,所以只能使用:deepseek-llm:7b。因为,deepseek_v2这个模型在该配置下跑不起来。

#人工智能
长周期 AI Agent 的高效 Harness 设计 —— Anthropic 工程实践深度解析

失败模式解决方案Agent 尝试一次性完成整个应用功能列表 + 增量式进展(一次一个功能)后续 Agent 过早宣布完成功能列表明确标记完成状态会话之间丢失上下文claude-progress.txt + git 日志代码状态混乱描述性 commit + 进度摘要测试不充分浏览器自动化 + 端到端测试无法快速恢复工作状态init.sh + 基础测试流程有效的 Agent 系统设计需要从人类工程实践

#人工智能
Semble:专为 AI Agent 打造的极速代码搜索引擎

Semble是一款专为AI Agent设计的极速代码搜索引擎,旨在解决AI编程助手在大型代码库中高效定位代码片段的问题。相比传统grep+read方式,Semble能在毫秒级时间内返回精确结果,节省约98%的token消耗,同时保持与专业Transformer模型相当的检索质量。核心功能包括自然语言代码搜索、极速索引与查询、Token高效利用以及多种接入方式。其混合检索架构结合语义和词法检索,通过

Claude Code实现原理分析-架构设计

Claude Code是一个完整的AI Agent运行时框架,具备终端交互、多Agent协作和智能编程能力。其分层架构包括接入层、交互控制层、核心引擎层等6个层级,采用严格自上而下的依赖关系。核心模块包括多入口启动系统、负责LLM调用的QueryEngine引擎,以及基于接口驱动的插件化工具系统。该系统支持40+可组合工具、多Agent并行编排、持久化记忆等功能,采用TypeScript+Bun技

#人工智能
    共 67 条
  • 1
  • 2
  • 3
  • 7
  • 请选择