logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

00 架构全景 - Claude Code 五层架构详解

不同帮工(读文件、写文件、跑 shell、搜代码、调子 Agent)各有各的规矩和上岗证(权限)。就像餐厅的前台或服务员,负责把你说的话(输入)接进来,再把厨房做好的菜(AI 回复、工具执行结果)漂漂亮亮地端到你面前。接到前台传来的订单后,经理负责安排桌号(会话状态)、记账算成本、把对话记录归档(持久化),决定什么时候该让后厨(核心循环)出手,并管理整个用餐流程的节奏。不管大厨多厉害,要和真正的

#架构
从llama.cpp开始的guff格式转换到ollama部署

首先在windows部署了llama.cpp,然后将qwen2.5微调后的模型转换为guff格式到ollama部署(因为ollama并不支持qwen的.safetensor部署,所以需要转换格式)。哈哈,我电脑的配置是3050+12G显存,用的是q8_0的Qwen2.5-7B模型,实际运行占用了11GB显存,内存占满了(估计就是4G左右,我电脑就没空间了)。(4)最后安装CUDA,如果先安装会出现

到底了