
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了科研调研Agent项目ScholarCraft的三个核心改进:论文库深度整理、三层记忆系统和上下文工程。通过Zotero导出和LLM自动填充,论文库从3篇扩充到26篇结构化文献,补全了核心指标数据。记忆系统采用工作记忆、短期记忆(SQLite持久化+摘要压缩)和长期记忆(SQLite+ChromaDB)三层架构,实现了会话内和跨会话的上下文管理。上下文工程引入Token预检、熔断机制和工
摘要:ScholarCraft是一个基于混合模型的科研调研Agent,通过本地Qwen3-4B与远端MiMoAPI协同工作,实现了自主文献检索、评估与报告生成功能。项目已完成核心升级:1)搜索系统采用多角度策略与智能评估机制;2)工具能力增强,支持双路径论文读取与结构化对比;3)本地论文库扩充至26篇跨领域文献;4)报告质量提升,采用深度结构化模板。当前系统能稳定执行"搜索-评估-阅读-
项目摘要: ScholarCraft 是一个基于本地与云端混合模型的科研调研Agent,旨在通过自主规划、工具调用和论文阅读生成结构化报告。项目采用 LangGraph + Ollama(Qwen3-4B) + 小米MiMoAPI 技术栈,已完成核心闭环(任务规划→工具调用→联网检索→报告生成),并集成 MCP协议 和 迭代式检索机制。 核心能力: 任务规划:通过MiMoAPI拆解模糊需求为结构化
项目摘要: ScholarCraft 是一个基于本地与云端混合模型的科研调研Agent,旨在通过自主规划、工具调用和论文阅读生成结构化报告。项目采用 LangGraph + Ollama(Qwen3-4B) + 小米MiMoAPI 技术栈,已完成核心闭环(任务规划→工具调用→联网检索→报告生成),并集成 MCP协议 和 迭代式检索机制。 核心能力: 任务规划:通过MiMoAPI拆解模糊需求为结构化
本文总结了LiteRAG项目从规划到落地的完整开发历程。作者最初规划了包含多模态支持、用户权限管理等功能的"大而全"架构,但在实际开发中聚焦于RAG核心链路的深度优化。项目最终实现了混合检索(加权RRF融合)、Reranker精排、自动化评估闭环等核心功能,并建立了完整的监控体系。通过技术选型调整(如BGE-M3嵌入模型、Qwen3.5-Flash API等)和持续优化,关键指

《从0.50到0.80:LiteRAG召回率优化实战》记录了将RAG系统核心指标全面优化的完整过程。文章首先通过RAGAS评估框架发现初始系统存在高精度低召回问题(ContextRecall仅0.50),随后通过代码审计发现4个P0级缺陷,包括查询改写禁用、缓存设计缺陷等。核心优化包括:升级多语言Embedding模型、强化专业术语分词、引入加权RRF融合算法,最终将召回率提升60%至0.80,精

本文探讨了大模型推理中KVCache显存管理的核心问题与解决方案。随着上下文长度增加,KVCache显存占用呈线性增长(4096token即需2GB显存),成为推理瓶颈。作者提出通过分层存储架构(GPU显存→CPU内存→SSD)实现KVCache卸载,并开发了一个500行C++原型系统,包含三大关键技术:内存池管理(预分配对齐内存)、LRU驱逐策略(O(1)复杂度双向链表实现)、磁盘序列化(二进制
本文详细记录了存储领域大模型SFT(监督微调)的全过程。作者通过三层策略构建了523条高质量指令数据,包括手写核心样本和API批量生成数据。在6GB显存的限制下,采用QLoRA(4bit)和rank=8的配置完成微调,loss从2.43降至1.62。效果评估显示,SFT模型在专业术语使用、回答结构化和自然度方面显著提升,但也暴露出概念泛化不足的问题。文章还总结了数据生成、格式处理和显存优化等实战经

本文记录了从SFT模型修复到部署探索的全过程。在发现SFTv1模型存在选择性遗忘和概念理解错误后,通过三轮数据迭代(强制详述、问题改写等策略)将模型打磨至可用状态,成功解决了80%的核心问题。随后在6GB显卡环境下探索了多种部署方案(vLLM、bitsandbytes、llama.cpp、GPTQ),最终获得FP16基线数据并形成4-bit量化收益预估。项目完整呈现了模型训练与部署中的典型挑战,包

本文记录了作者在DPO偏好对齐失败后,通过三轮迭代修复SFT模型的过程。首先发现SFTv1存在选择性遗忘和概念理解错误,通过建立10道标准测试题进行全面评估。第一轮采用强制详述策略补充41条样本,修复了部分问题但仍存在泛化不足;第二轮通过问题改写策略建立简单问法与详述回答的直接映射,使80%的评估题达标。最终选定SFTv3为最终模型,并总结了DPO失败的四大原因及改进方案。文章强调数据质量决定模型








