木雷坞个人主页

@mliev

木雷坞

2025-06-03 14:04:40 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

MCP Agent 内测部署：先把多源镜像拉取跑通

本文总结了MCP Agent内测部署时遇到的镜像拉取问题及解决方案。主要步骤包括：1)列出所有组件镜像清单；2)使用毫秒镜像域名统一替换多源镜像；3)修改Docker Compose文件规范镜像地址；4)K8s节点预检和镜像预拉取；5)强调稳定镜像源对安全运行时的重要性。文章建议部署前先确保镜像拉取链路畅通，避免无效调试，并提供了毫秒镜像作为统一解决方案来处理Docker Hub、GHCR、Qua

#docker #MCP #运维

LiteLLM Docker 部署：config.yaml、Master Key 和 Postgres 配置

本文介绍了使用Docker部署LiteLLM作为AI模型调用统一网关的方案。重点包括：采用官方镜像源，通过config.yaml配置模型路由和fallback机制，使用.env管理密钥，Postgres持久化配置和预算，Redis缓冲高流量。部署后业务应用通过统一接口调用内部模型名，网关负责密钥管理、路由转发和故障切换。文章提供了验证请求示例和常见问题排查指引，并强调生产环境需固定版本、做好备份和

#docker #容器 #运维

AI Agent 接入 MCP 工具后的部署排查：依赖、目录、权限

本文探讨了AI Agent工具环境的排查方法，重点分析了接入MCP工具后出现的常见问题。文章指出，AI Agent最适合处理"需要上下文+需要动作"的工作场景，如代码巡检、PR辅助、Web测试等。作者提出了一套完整的排查流程：从依赖检查、Compose拆分、启动验证到权限控制和日志记录。特别强调要限制工具权限，建议从只读权限开始，并避免挂载敏感目录。最后提供了一份检查清单，包括

#人工智能 #docker #容器 +1

LiteLLM Docker 部署：config.yaml、Master Key 和 Postgres 配置

#docker #容器 #运维

Playwright MCP Docker 部署：mcr 镜像、浏览器工具和权限配置

Playwright MCP 解决的是 Agent 操作浏览器的工具接口问题，Docker 解决的是运行时边界问题。部署时不要只看镜像是否能拉下来，还要把 MCP JSON、容器生命周期、输出目录、账号权限和网络范围一起检查。毫秒镜像在这里的作用很具体：当镜像来自 MCR 时，用先做拉取预检。镜像阶段通过后，后面的重点是浏览器工具边界。

#docker #容器 #运维 +1

Qdrant Docker 部署教程：数据卷、API Key 和集合初始化

本文介绍了使用Docker Compose部署Qdrant向量数据库的方法，适用于内网知识库、语义搜索等场景。主要内容包括：1）环境配置说明，使用官方镜像和默认端口；2）安全设置，通过API Key实现访问控制；3）使用Docker Compose编排服务；4）collection创建和向量维度配置；5）建议的元数据字段设计；6）反向代理和备份策略。文章提供了完整的配置示例和验证方法，并解答了常见

#docker #容器 #运维 +1

Open WebUI Docker 部署：连接 Ollama、数据卷和镜像拉取排查

本文详细介绍了Open WebUI的Docker部署流程，重点解决三大常见问题：1) GHCR镜像拉取困难时可使用毫秒镜像入口预检；2) 连接宿主机Ollama服务时需注意容器网络配置；3) 通过数据卷持久化配置。文章提供了最小化启动命令、参数解释及Docker Compose示例，并针对镜像拉取失败、页面无法打开、模型不可见等问题给出排查方法。部署时建议按顺序检查镜像拉取、容器启动、端口映射、O

#docker #运维 #人工智能

AI Gateway 接入大模型服务后首 token 慢排查：镜像、模型缓存和 GPU 节点

《内网推理服务首token延迟问题排查指南》摘要：本文针对AI推理服务中首次请求响应慢的典型问题，提出了一套系统排查方案。首先需验证基础镜像来源（vLLM/CUDA/K8s组件）的完整性和兼容性，其次检查模型加载路径是否存在存储瓶颈。重点排查方向包括：GPU运行环境是否正常挂载、网关超时设置是否合理、就绪探针是否过早放行流量。建议采用分步验证策略，从镜像预检、模型预热到网关策略逐层排查，特别要注

#人工智能 #gateway #缓存

vLLM 模型服务上线前压测：Docker 镜像、GPU 和 k6 基线检查

本文提供vLLM模型服务上线前的压测检查清单，涵盖镜像验证、GPU运行时检查、模型缓存配置和性能测试等关键环节。通过分步验证Docker镜像、GPU可用性、模型挂载方式，记录冷启动时间，并使用k6工具进行多级并发压测（10/20/50并发），最终形成包含镜像版本、GPU状态、冷启动耗时、性能指标和风险提示的完整上线报告模板，为后续扩容和问题排查建立基准。

#docker #java #k8s

vLLM 服务启动慢排查：NAS 模型目录、Docker 镜像和 GPU Runtime

摘要：本文记录了一次vLLM启动缓慢的排查过程，重点分析了模型文件存放在NAS上时可能出现的各类问题。文章将排查流程分为五个层次：Docker镜像验证、NAS挂载检查、权限与读取速度测试、GPU运行时确认以及vLLM服务就绪检查。针对每个环节提供了详细的诊断命令和解决方案，特别强调了多节点环境下版本一致性、NAS读写权限和延迟测试的重要性。通过系统化的分层排查方法，可以有效定位vLLM启动缓慢的根

#docker #容器

共 22 条

请选择