
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
AI Agent 的核心不是“模型更聪明”,而是“系统能围绕目标持续观察、推理、行动和校验”。MCP 解决连接问题:Agent 能访问哪些工具、数据和外部系统。Skills 解决方法问题:Agent 应该按什么流程、标准和风格完成任务。真正可用的 Agent 往往不是单独靠模型、单独靠 MCP、或者单独靠 Skill,而是三者组合:模型负责推理,MCP 负责触达外部世界,Skills 负责把团队经

微调 = 在一个已经学会"通用语言能力"的预训练大模型基础上,用少量特定数据继续训练,让它学会新的技能或适应新的场景。预训练(通用能力)—— 花费千万美元,数月时间↓SFT 监督微调(学会执行指令、掌握领域知识)—— 花费数百美元,数小时↓对齐训练(学会区分好坏、安全负责地回答)—— 花费数百美元,数小时↓部署服务每一步都在前一步的基础上做增量优化。你不一定每一步都需要——很多场景只做 SFT 就

Prompt 可以提醒模型遵守规则,但不能承担全部安全责任。环节应做什么不要只做什么SFT/偏好数据覆盖动作 + 原则化理由 + 角色边界只收拒绝模板RL 环境加入工具、系统提示、权限变化和多角色上下文只做聊天式 harmful request测 OOD 场景和新工具组合只测训练分布附近题部署治理权限分级、人工审批、日志审计、回滚机制只靠模型自觉事故复盘把失败转成新场景、新理由、新评测只补一条规则

如果只看传播标题,ds4 很容易被讲成一个“2-bit 奇迹”。用不对称 2-bit 量化把 DeepSeek V4 Flash 的 routed experts 压进 128GB 级别机器;用 Metal-only 的专用路径服务 Apple Silicon;把 KV Cache 从纯内存对象变成可落盘、可恢复、可淘汰、可观测的状态;提供 OpenAI / Anthropic 兼容 API,让

现代大语言模型(LLM)训练是一个多阶段的流水线过程,主要包括五个关键阶段:数据准备、预训练、持续预训练、对齐训练和推理训练。预训练阶段通过next-token预测构建基础模型能力,而对齐训练(SFT和偏好学习)则校准模型行为方向。最新的发展是推理训练阶段,通过强化学习(如RLVR、GRPO)专门提升模型的长思考能力。不同厂商(如OpenAI、DeepSeek、Meta)采用相似但各有特色的训练流

本文深入剖析Claude Code的harness设计,揭示其核心工程思想。通过分析近20万行TypeScript源码,提炼出6大关键子系统:主循环采用AsyncGenerator状态机设计,子agent系统实现隔离与缓存共享,工具系统遵循fail-closed原则,4层压缩策略优化token使用,扩展机制包含27个生命周期事件,以及自研渲染与跨端方案。研究指出,Anthropic通过将harne

摘要: AI降低了创业执行门槛,但创业仍需分阶段验证核心问题。Claude《The Founder’s Playbook》提出四阶段证据门:Idea阶段验证问题真实性(problem-solution fit),MVP阶段确认用户复用价值(PMF),Launch阶段验证可重复增长,Scale阶段建立系统化运营能力。AI工具(Chat/Cowork/Code)可辅助各阶段工作,但创始人需警惕"形式完

本文对比分析了Claude Code和OpenAI Codex CLI两种AI代理工具的设计哲学差异。Claude Code采用TypeScript构建,通过复杂的状态机系统和类型约束实现"加法式"设计,将决策逻辑编码进1900多个TS文件中;而Codex CLI则采用Rust编写,通过操作系统级沙箱和精简枚举实现"减法式"设计,将安全保证下放至系统调用层。两者在主循环、工具系统、权限控制等方面展

回到开头的问题:智能体真的需要 RAG 吗?答案是:智能体需要接地,不一定需要 RAG。RAG 是接地层里的一个重要工具,尤其适合企业非结构化知识问答,但它不能替代工具调用、数据库查询、长上下文和记忆系统。理解这一点,就不会陷入两个极端。一个极端是把 RAG 神化,好像所有企业 AI 问题都能靠“向量库 + Prompt”解决。这个想法忽略了检索质量、权限、新鲜度、评估和结构化数据的复杂性。另一个

这类工具更新太快,版本、价格、模型支持和功能名都会变。先定入口:终端、IDE、GitHub、消息渠道,哪个最贴近你的真实工作?再定权限:它默认能做什么,什么动作需要审批,是否有沙箱?再定记忆:项目规则、用户偏好、团队知识如何沉淀和纠错?再定扩展:MCP、Hooks、Skills、插件市场,哪个对你的团队最可维护?最后看成本:订阅费、模型费、迁移费、治理费、运维费都要算。








