logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【以claude code和CodeX引发的缓存技术思考】商业软件的差异化壁垒—— 提示缓存协议(一)基础篇和协议黑盒方案

本文探讨了AI时代中代码信息过载问题,提出应聚焦决策力与创新力。文章以Claude Code为例,深入解析了高级缓存协议的核心技术: 前缀缓存机制通过复用重复请求部分降低系统开销,VLLM等框架已原生支持 分析了前缀缓存不稳定的7大原因,包括动态prompt、工具变更等 提出Claude Code的三段式解决方案: 将请求拆分为稳定前缀/半稳定区/动态尾部 规范化输入确保字节级一致 设计包含多维度

#缓存
【LLM转型三周年纪念——Harness agent 理解】成为每个读者的独家记忆,从第一性原则出发,一文打穿你的AI幻觉,除了模型,或许你自己就是harness

本文探讨了从CV转型NLP过程中对LLM应用开发的认知转变,重点分析了"Harness工程"的核心思想。作者认为Harness不是简单地约束模型,而是构建责任系统:模型生成行动方案,Harness负责权限、审计、回滚等制度保障,形成"智能下放、责任上提"的架构。文章批驳了"AI让代码贬值"的观点,指出系统性工程代码反而在升值,并强调理解模

#人工智能#log4j
复习笔记——BN基础”回炉“,我所熟悉的BN知识

复习笔记——BN基础算法”回炉“复习笔记——基础为王,回顾基础,搞扎实是很有必要的,今天我抱着复习的目的和大家分享我理解的BN层,如有错误,欢迎批评指正以及补充.文章目录复习笔记——BN基础算法”回炉“BN一、Batch Normalization二、默写下公式和代码1. 手写公式2.torch 的BN3.跨卡BN问题4.关于我知道的BN trick三、总结BN效果BNBatch Normaliz

#深度学习
到底了