
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
agent的整体架构
AI Agent(智能体)的整体架构通常采用**“感知-记忆-推理-执行”闭环设计**,并随着多智能体协同、端侧部署和标准化协议的发展不断演进。截至2026年,业界已形成相对共识的分层架构。
RAG跟微调的取舍问题
如果知识是动态、可检索、需要出处的,选 RAG;如果目标是改变模型的“说话方式”或输出结构,选微调。多数生产级应用建议两者结合。
生产级的复杂RAG系统流程
步骤基础RAG复杂RAG查询处理直接使用原始查询查询改写(HyDE、多查询、拆分等)检索方式单一向量检索混合检索(向量 + 关键词/BM25)结果处理直接取向量检索的Top-KRRF融合 + 重排序模型+ 上下文压缩检索精度中低高计算开销低高(多次LLM调用、重排模型)适用场景原型、简单问答生产环境、高要求、复杂知识库一个复杂的RAG系统通过引入查询改写、混合检索、重排序等一系列模块,大幅提升了最
LlamaIndex + Qwen3.5-4B 关闭 Thinking 模式调试记录
Qwen3.5系列所有带 thinking 功能的模型(4B 及以上)关闭 Thinking 模式
python生成单个文字图片素材(白底黑字)
#!/usr/bin/env python# coding=utf-8from PIL import Image, ImageDraw, ImageFont#image = Image.new(mode='RGBA', size=(50, 50),)image = Image.new("RGB",(50,50),"white")draw_table = Im
到底了







