
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
- 先搞清“上游增量”还是“下游优化”:选错赛道,再强技术也可能在替巨头做功能验证。- 需求验证不要只看“模型准确率”,要看端上是否形成闭环:用户能不能完成任务/会不会留下来/失败时是否能继续走下去。- 技术落地优先“成熟模型 + 微调 + 工程封装”,避免早期陷入“底层重研发”的工程壁垒陷阱;端上重点是缓存、降级、取消与队列。- 体验设计要“藏复杂于无形”:把“参数/术语”翻译成用户能理解的目标
摘要 Harness Engineering聚焦于构建大语言模型的工作系统,使其能力可稳定复用而非单纯提升性能。大语言模型存在无状态性、输出局限性、上下文窗口限制和概率性输出等结构性缺陷,这些问题在长任务中会被放大。Harness采用四层架构:记忆层(持久化存储)、执行层(可操作工具)、反馈层(确定性验证)和编排层(多任务协调)。代码领域因其"生成概率性但验证确定性"的特点成为
摘要 Harness Engineering是AI工程的最新范式,关注如何设计系统机制确保模型可靠完成任务,而非单纯提升模型能力。它标志着从Prompt到Context再到Harness的三阶段演进(Prompt ⊂ Context ⊂ Harness),核心解决多步任务中的系统性失败问题。 2026年其兴起源于四个关键因素:模型能力临界点、长任务失败模式显现、累积误差导致的可靠性崩塌,以及模型商
摘要: Token是大模型处理文本的基本单位,由分词器将字符串切分为数字序列。输入Token通常更便宜,因其可并行处理;而输出Token需自回归逐生成,计算效率低,成本更高。Tokenizer基于统计切分文本,同一字符串的Token划分稳定,但上下文变化可能影响边界。计费上,输入/输出Token分开计价,输出成本显著更高。前缀缓存机制可复用固定前缀的计算结果,提升效率,但前缀变化会导致重新计算,增
摘要 本文从工程视角探讨了Agent系统中模型能力与工程框架的关系,提出了以下核心观点: 模型能力与工程框架不是对立关系,而是互补关系: 模型(Big Model)决定能力上限 工程框架(Big Harness)决定能力兑现率和稳定性 将Agent系统分为四个层次: 工具可达层(长期基础设施) 试错闭环层(反馈回路) 认知型编排层(会被模型压缩) 模型选型层(决定上限) 指出两种常见误区: 过度依
摘要 本文从工程视角探讨了Agent系统中模型能力与工程框架的关系,提出了以下核心观点: 模型能力与工程框架不是对立关系,而是互补关系: 模型(Big Model)决定能力上限 工程框架(Big Harness)决定能力兑现率和稳定性 将Agent系统分为四个层次: 工具可达层(长期基础设施) 试错闭环层(反馈回路) 认知型编排层(会被模型压缩) 模型选型层(决定上限) 指出两种常见误区: 过度依
- 一句话结论:Agent 不是“更会聊天的 LLM”,而是一个可构建、可运行、可治理的软件工程系统:用模型在可重复的控制回路里做事,并在工具、上下文、部署与治理上补齐“生产级能力”。- 落地路径:先把 Level 1(事实闭环)跑稳,再做 Level 2(上下文工程),最后才谈多智能体与规模化治理。- 最大风险:多数团队“只做了模型 + 工具”,缺了编排层与运行时,导致 Demo 很美、生产必翻
摘要:Skill 机制解析 Skill 是一种可被发现、按需加载、带资产与脚本的能力包,通常以文件夹形式存在。其核心流程分为三个阶段: Discovery:客户端仅发送各Skill的简短metadata给模型,告知可用能力而不占用过多token Activation:模型根据问题选择合适Skill后,客户端加载完整SKILL.md内容 Execution:模型在约束下执行脚本、读取文件,生成可直接
摘要 AI Agent与普通大模型的核心区别在于任务闭环能力。Agent由三部分组成:模型负责决策,工具提供行动能力,编排层管理执行流程。其灵魂是Think-Act-Observe循环,通过多轮迭代推进任务。Agent能力可分为5级:从基础问答到多智能体协作和自我进化。生产落地的难点在于工程化,包括工具契约、上下文管理、评测体系等。真正的价值不在于模型规模,而在于系统能否可靠完成实际任务。
Kotlin 2025-2026 客户端开发路线聚焦三大方向:语言升级、跨端落地和AI Agent入门。Kotlin 2.x将保持每6个月的语言大版本更新节奏,K2编译器及IDE模式带来显著性能提升。跨端开发进入工程化阶段,KMP负责业务逻辑共享,Compose Multiplatform实现UI共享。JetBrains推出的Koog框架为端侧AI应用开发提供支持。文章详细解析了K2编译器的优势、







