
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
00 架构全景 - Claude Code 五层架构详解
不同帮工(读文件、写文件、跑 shell、搜代码、调子 Agent)各有各的规矩和上岗证(权限)。就像餐厅的前台或服务员,负责把你说的话(输入)接进来,再把厨房做好的菜(AI 回复、工具执行结果)漂漂亮亮地端到你面前。接到前台传来的订单后,经理负责安排桌号(会话状态)、记账算成本、把对话记录归档(持久化),决定什么时候该让后厨(核心循环)出手,并管理整个用餐流程的节奏。不管大厨多厉害,要和真正的
从llama.cpp开始的guff格式转换到ollama部署
首先在windows部署了llama.cpp,然后将qwen2.5微调后的模型转换为guff格式到ollama部署(因为ollama并不支持qwen的.safetensor部署,所以需要转换格式)。哈哈,我电脑的配置是3050+12G显存,用的是q8_0的Qwen2.5-7B模型,实际运行占用了11GB显存,内存占满了(估计就是4G左右,我电脑就没空间了)。(4)最后安装CUDA,如果先安装会出现
到底了







