logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI Agent 落地入门:从模型、工具到 Skills 与 MCP 的分工

AI Agent 的核心不是“模型更聪明”,而是“系统能围绕目标持续观察、推理、行动和校验”。MCP 解决连接问题:Agent 能访问哪些工具、数据和外部系统。Skills 解决方法问题:Agent 应该按什么流程、标准和风格完成任务。真正可用的 Agent 往往不是单独靠模型、单独靠 MCP、或者单独靠 Skill,而是三者组合:模型负责推理,MCP 负责触达外部世界,Skills 负责把团队经

文章图片
#人工智能#MCP
大模型微调技术完全指南:从原理到实践的系统性入门(2026 版)

微调 = 在一个已经学会"通用语言能力"的预训练大模型基础上,用少量特定数据继续训练,让它学会新的技能或适应新的场景。预训练(通用能力)—— 花费千万美元,数月时间↓SFT 监督微调(学会执行指令、掌握领域知识)—— 花费数百美元,数小时↓对齐训练(学会区分好坏、安全负责地回答)—— 花费数百美元,数小时↓部署服务每一步都在前一步的基础上做增量优化。你不一定每一步都需要——很多场景只做 SFT 就

文章图片
#人工智能#LoRA
教 Claude “为什么”:为什么理由训练比动作示范更能迁移到 Agent 安全

Prompt 可以提醒模型遵守规则,但不能承担全部安全责任。环节应做什么不要只做什么SFT/偏好数据覆盖动作 + 原则化理由 + 角色边界只收拒绝模板RL 环境加入工具、系统提示、权限变化和多角色上下文只做聊天式 harmful request测 OOD 场景和新工具组合只测训练分布附近题部署治理权限分级、人工审批、日志审计、回滚机制只靠模型自觉事故复盘把失败转成新场景、新理由、新评测只补一条规则

文章图片
#安全#人工智能#AI
128GB MacBook 跑 DeepSeek V4 Flash:ds4.c 真正突破的不是 2-bit,而是本地 Agent 的工程闭环

如果只看传播标题,ds4 很容易被讲成一个“2-bit 奇迹”。用不对称 2-bit 量化把 DeepSeek V4 Flash 的 routed experts 压进 128GB 级别机器;用 Metal-only 的专用路径服务 Apple Silicon;把 KV Cache 从纯内存对象变成可落盘、可恢复、可淘汰、可观测的状态;提供 OpenAI / Anthropic 兼容 API,让

文章图片
#AI
现代 LLM 是怎么训练出来的:从 2017 Transformer 到 2026 推理时代的工程全景

现代大语言模型(LLM)训练是一个多阶段的流水线过程,主要包括五个关键阶段:数据准备、预训练、持续预训练、对齐训练和推理训练。预训练阶段通过next-token预测构建基础模型能力,而对齐训练(SFT和偏好学习)则校准模型行为方向。最新的发展是推理训练阶段,通过强化学习(如RLVR、GRPO)专门提升模型的长思考能力。不同厂商(如OpenAI、DeepSeek、Meta)采用相似但各有特色的训练流

文章图片
#transformer#人工智能#AI
Claude Code 源码里的 Harness 设计:从主循环到 4 层压缩的工程细节

本文深入剖析Claude Code的harness设计,揭示其核心工程思想。通过分析近20万行TypeScript源码,提炼出6大关键子系统:主循环采用AsyncGenerator状态机设计,子agent系统实现隔离与缓存共享,工具系统遵循fail-closed原则,4层压缩策略优化token使用,扩展机制包含27个生命周期事件,以及自研渲染与跨端方案。研究指出,Anthropic通过将harne

文章图片
#人工智能#AI
AI 原生创业四阶段 Playbook:Claude《The Founder’s Playbook》的可执行读法

摘要: AI降低了创业执行门槛,但创业仍需分阶段验证核心问题。Claude《The Founder’s Playbook》提出四阶段证据门:Idea阶段验证问题真实性(problem-solution fit),MVP阶段确认用户复用价值(PMF),Launch阶段验证可重复增长,Scale阶段建立系统化运营能力。AI工具(Chat/Cowork/Code)可辅助各阶段工作,但创始人需警惕"形式完

文章图片
#人工智能#AI
Claude Code 与 Codex Harness 设计对比:一种加法,一种减法

本文对比分析了Claude Code和OpenAI Codex CLI两种AI代理工具的设计哲学差异。Claude Code采用TypeScript构建,通过复杂的状态机系统和类型约束实现"加法式"设计,将决策逻辑编码进1900多个TS文件中;而Codex CLI则采用Rust编写,通过操作系统级沙箱和精简枚举实现"减法式"设计,将安全保证下放至系统调用层。两者在主循环、工具系统、权限控制等方面展

文章图片
RAG 与 AI Agent:智能体真的需要检索增强生成吗?

回到开头的问题:智能体真的需要 RAG 吗?答案是:智能体需要接地,不一定需要 RAG。RAG 是接地层里的一个重要工具,尤其适合企业非结构化知识问答,但它不能替代工具调用、数据库查询、长上下文和记忆系统。理解这一点,就不会陷入两个极端。一个极端是把 RAG 神化,好像所有企业 AI 问题都能靠“向量库 + Prompt”解决。这个想法忽略了检索质量、权限、新鲜度、评估和结构化数据的复杂性。另一个

文章图片
#人工智能#数据库#RAG +1
AI Agent 工具选型:OpenClaw、Hermes、Claude Code、Codex、Cursor、Copilot 怎么选

这类工具更新太快,版本、价格、模型支持和功能名都会变。先定入口:终端、IDE、GitHub、消息渠道,哪个最贴近你的真实工作?再定权限:它默认能做什么,什么动作需要审批,是否有沙箱?再定记忆:项目规则、用户偏好、团队知识如何沉淀和纠错?再定扩展:MCP、Hooks、Skills、插件市场,哪个对你的团队最可维护?最后看成本:订阅费、模型费、迁移费、治理费、运维费都要算。

文章图片
#copilot#AI
    共 57 条
  • 1
  • 2
  • 3
  • 6
  • 请选择