logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI 时代黄金产品研发指南:从赛道选择到技术落地的实战手册

- 先搞清“上游增量”还是“下游优化”:选错赛道,再强技术也可能在替巨头做功能验证。- 需求验证不要只看“模型准确率”,要看端上是否形成闭环:用户能不能完成任务/会不会留下来/失败时是否能继续走下去。- 技术落地优先“成熟模型 + 微调 + 工程封装”,避免早期陷入“底层重研发”的工程壁垒陷阱;端上重点是缓存、降级、取消与队列。- 体验设计要“藏复杂于无形”:把“参数/术语”翻译成用户能理解的目标

#人工智能
Harness Engineering:把大语言模型从“能说”变成“能稳定交付”的四层系统

摘要 Harness Engineering聚焦于构建大语言模型的工作系统,使其能力可稳定复用而非单纯提升性能。大语言模型存在无状态性、输出局限性、上下文窗口限制和概率性输出等结构性缺陷,这些问题在长任务中会被放大。Harness采用四层架构:记忆层(持久化存储)、执行层(可操作工具)、反馈层(确定性验证)和编排层(多任务协调)。代码领域因其"生成概率性但验证确定性"的特点成为

#语言模型#人工智能#自然语言处理
2026 年 AI 工程新范式:Harness Engineering 深度解析

摘要 Harness Engineering是AI工程的最新范式,关注如何设计系统机制确保模型可靠完成任务,而非单纯提升模型能力。它标志着从Prompt到Context再到Harness的三阶段演进(Prompt ⊂ Context ⊂ Harness),核心解决多步任务中的系统性失败问题。 2026年其兴起源于四个关键因素:模型能力临界点、长任务失败模式显现、累积误差导致的可靠性崩塌,以及模型商

#人工智能#算法#机器学习
大模型 Token 科普:什么是 Token?为什么输出 Token 更贵?

摘要: Token是大模型处理文本的基本单位,由分词器将字符串切分为数字序列。输入Token通常更便宜,因其可并行处理;而输出Token需自回归逐生成,计算效率低,成本更高。Tokenizer基于统计切分文本,同一字符串的Token划分稳定,但上下文变化可能影响边界。计费上,输入/输出Token分开计价,输出成本显著更高。前缀缓存机制可复用固定前缀的计算结果,提升效率,但前缀变化会导致重新计算,增

#java#开发语言
Skill 编写最佳实践:如何写好一个 Skill(从创建到迭代)

摘要 本文从工程视角探讨了Agent系统中模型能力与工程框架的关系,提出了以下核心观点: 模型能力与工程框架不是对立关系,而是互补关系: 模型(Big Model)决定能力上限 工程框架(Big Harness)决定能力兑现率和稳定性 将Agent系统分为四个层次: 工具可达层(长期基础设施) 试错闭环层(反馈回路) 认知型编排层(会被模型压缩) 模型选型层(决定上限) 指出两种常见误区: 过度依

别再争 Big Model vs Big Harness:用工程视角拆开 Agent 的“上限”和“兑现率”

摘要 本文从工程视角探讨了Agent系统中模型能力与工程框架的关系,提出了以下核心观点: 模型能力与工程框架不是对立关系,而是互补关系: 模型(Big Model)决定能力上限 工程框架(Big Harness)决定能力兑现率和稳定性 将Agent系统分为四个层次: 工具可达层(长期基础设施) 试错闭环层(反馈回路) 认知型编排层(会被模型压缩) 模型选型层(决定上限) 指出两种常见误区: 过度依

Google AI Agent 白皮书拆解(1):从《Introduction to Agents》看清 Agent 的工程底座

- 一句话结论:Agent 不是“更会聊天的 LLM”,而是一个可构建、可运行、可治理的软件工程系统:用模型在可重复的控制回路里做事,并在工具、上下文、部署与治理上补齐“生产级能力”。- 落地路径:先把 Level 1(事实闭环)跑稳,再做 Level 2(上下文工程),最后才谈多智能体与规模化治理。- 最大风险:多数团队“只做了模型 + 工具”,缺了编排层与运行时,导致 Demo 很美、生产必翻

#人工智能
Skill 到底是什么:用 tech-visual-style-kit 拆解 Discovery / Activation / Execution

摘要:Skill 机制解析 Skill 是一种可被发现、按需加载、带资产与脚本的能力包,通常以文件夹形式存在。其核心流程分为三个阶段: Discovery:客户端仅发送各Skill的简短metadata给模型,告知可用能力而不占用过多token Activation:模型根据问题选择合适Skill后,客户端加载完整SKILL.md内容 Execution:模型在约束下执行脚本、读取文件,生成可直接

#人工智能#前端
从“会聊天”到“会做事”:一篇看懂 AI Agent 架构的底层逻辑

摘要 AI Agent与普通大模型的核心区别在于任务闭环能力。Agent由三部分组成:模型负责决策,工具提供行动能力,编排层管理执行流程。其灵魂是Think-Act-Observe循环,通过多轮迭代推进任务。Agent能力可分为5级:从基础问答到多智能体协作和自我进化。生产落地的难点在于工程化,包括工具契约、上下文管理、评测体系等。真正的价值不在于模型规模,而在于系统能否可靠完成实际任务。

#人工智能#架构#大数据
Kotlin 2025–2026 客户端开发路线:语言升级 × 跨端落地 × AI Agent 入门

Kotlin 2025-2026 客户端开发路线聚焦三大方向:语言升级、跨端落地和AI Agent入门。Kotlin 2.x将保持每6个月的语言大版本更新节奏,K2编译器及IDE模式带来显著性能提升。跨端开发进入工程化阶段,KMP负责业务逻辑共享,Compose Multiplatform实现UI共享。JetBrains推出的Koog框架为端侧AI应用开发提供支持。文章详细解析了K2编译器的优势、

#kotlin#人工智能#开发语言
    共 91 条
  • 1
  • 2
  • 3
  • 10
  • 请选择