Joseph Cooper 个人主页

@weixin_43444989

Joseph Cooper

2023-11-01 10:03:55 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

AI 原生创业四阶段 Playbook：Claude《The Founder’s Playbook》的可执行读法

摘要： AI降低了创业执行门槛，但创业仍需分阶段验证核心问题。Claude《The Founder’s Playbook》提出四阶段证据门：Idea阶段验证问题真实性（problem-solution fit），MVP阶段确认用户复用价值（PMF），Launch阶段验证可重复增长，Scale阶段建立系统化运营能力。AI工具（Chat/Cowork/Code）可辅助各阶段工作，但创始人需警惕"形式完

#人工智能 #AI

Claude Code 与 Codex Harness 设计对比：一种加法，一种减法

本文对比分析了Claude Code和OpenAI Codex CLI两种AI代理工具的设计哲学差异。Claude Code采用TypeScript构建，通过复杂的状态机系统和类型约束实现"加法式"设计，将决策逻辑编码进1900多个TS文件中；而Codex CLI则采用Rust编写，通过操作系统级沙箱和精简枚举实现"减法式"设计，将安全保证下放至系统调用层。两者在主循环、工具系统、权限控制等方面展

Claude Code 与 Codex Harness 设计对比：一种加法，一种减法

读 GBrain 源码：YC CEO 给 agent 造的“长期大脑“是怎么搭起来的

GBrain 是一个由 YC CEO Garry Tan开发的AI agent长期记忆系统，采用markdown wikilink作为抽取信号，通过三路索引（图谱、向量、关键词）和RRF融合实现高效检索。系统完全零LLM抽取，运行成本极低，已管理17,888个页面和34个技能。核心设计是将智能上移到fat skill层，执行下放到确定性工具层，保持中间层轻量化。通过自动抽取markdown中的链接

#AI

读 GBrain 源码：YC CEO 给 agent 造的“长期大脑“是怎么搭起来的

#AI

生产级 AI Agent 评估体系：从 12 指标框架到持续评估闭环

摘要生产级AI Agent评估体系是企业AI项目成败的关键。95%的AI试点失败源于缺乏评估体系，而非模型性能问题。本文提出12指标×4大类的评估框架，涵盖检索、生成、Agent行为和生产运维四大维度，形成持续评估闭环。核心指标包括：检索质量（相关度、召回率、精排）生成质量（忠实度、相关度、幻觉率） Agent行为（工具选择、执行成功率、多步连贯性）生产指标（成本、延迟）评估体系建设需

#人工智能 #AI

生产级 AI Agent 评估体系：从 12 指标框架到持续评估闭环

#人工智能 #AI

AI 原生创业四阶段 Playbook：Claude《The Founder’s Playbook》的可执行读法

#人工智能 #AI

AI Agent 框架选型：LangChain、LlamaIndex、Anthropic SDK 和 Codex/Claude Code 怎么选

AI Agent 技术栈可以用一句话压缩：模型调用是地基，RAG 解决数据，工具解决行动，编排解决流程，观测评估解决生产。只是使用 AI 做工作：用 Codex / Claude Code。只是调 Claude：用 Anthropic Client SDK。要复用 Claude Code 能力开发 Agent：用 Claude Agent SDK。要做通用多模型 Agent 应用：用 LangCh

#人工智能

共 53 条

请选择