
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
5个半小时,代码一行没改。网络层的坑已填平,但向量模型还卡在上下文参数上。Linux下Ollama校验严格,nomic-embed-text上限2048,默认配置过高直接阻塞。本文记录真实踩坑过程,非成功学。

针对 Ollama CPU 运行超时、长文本向量化报错问题,本文通过更换 32K 上下文模型、Docker GPU 部署的方式,实现了 3597 字符文本 3-5 秒处理,同时给出了验证 GPU 加速的关键数据与可复用命令。

完成 AI 解构成果至多知识库的自动化同步管道开发,通过定时任务、异步处理、幂等防重、分级过滤与兜底扫描设计,实现一次解构、多库复用,区分不同知识库存储规则,整套方案已开发部署完成。

本文基于 16G 内存 Ubuntu 服务器,提供 Ollama 0.20.4 手动二进制部署全流程,规避官方脚本 HTTP2 网络错误,无需 Docker,为本地 RAG 知识库搭建打下基础,属于《技术底稿》DevOps 实战系列。

本文记录了彻底弃用 LangChain4j 框架,自研 4 套 Spring Boot Starter(基础工具、文本处理、Ollama、Milvus),重构全链路可控 RAG 底座的实战过程,实现了爬虫分片、向量化、向量入库、AI 仿写的全链路打通,解决了第三方框架黑盒依赖问题,沉淀了可复用的个人 AI 基础设施。

本文从产品视角复盘了商助慧的一次关键架构迭代:弃用 LangChain4j 黑盒依赖,自研四套 Starter 重构全可控 RAG 链路,不改动上层业务逻辑,仅通过底层能力下沉实现架构可控与资产沉淀,为后续个人 Agent 项目复用底座打下基础。

这篇文章复盘了一次线上 Redis 认证异常导致的微服务全线故障,顺着报错线索排查 2 小时,最终收敛出一套包含 11 款常用中间件的标准重启运维手册,明确了依赖启动顺序、启停命令与排坑要点,帮你把故障恢复时间从 2 小时压缩到 5 分钟,是后端开发与服务器运维的实用干货。

基于 16G 单机服务器实战,讲解 Docker Compose 微服务平滑迁移至 K3s 全流程,全程无外网实现镜像离线导入,梳理镜像识别、文件挂载、Nginx 路由转发、跨架构服务互通等八大高频问题,附上真实内存资源占用对比数据,整理离线部署规范与实操命令,适配私有化离线项目快速落地参考。

低配单机混跑 Dev/Test 微服务环境,因 Jenkins 无隔离引发部署包错乱、服务启动报错。复盘完整排障过程,落地环境隔离、部署校验、日志规范与错峰启停方案,固化运维铁律,适配小团队低配服务器部署避坑参考。

本文从产品视角复盘了商助慧的一次关键架构迭代:弃用 LangChain4j 黑盒依赖,自研四套 Starter 重构全可控 RAG 链路,不改动上层业务逻辑,仅通过底层能力下沉实现架构可控与资产沉淀,为后续个人 Agent 项目复用底座打下基础。









