
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
这篇文章通过一个客服摘要平台的实际案例,详细拆解了如何在Kubernetes环境下优化AI推理服务的性能问题。作者发现最初将所有请求(在线短摘要和长上下文批处理)混入同一推理池的设计存在严重缺陷——长请求会阻塞短请求,导致客服界面响应缓慢。文章系统性地呈现了解决方案:通过请求分类(基于token数、任务类型)、建立多优先级推理池、改造网关路由策略,并设计了可观测的监控指标。特别强调了实施过程中的关

本文深入探讨了OpenAI Codex的核心功能与最佳实践。文章首先澄清了Codex作为本地工程协作者(而非简单聊天机器人)的定位,详细对比了其与普通ChatGPT的区别。针对用户常见问题,文章从协作模式选择、模型版本对比(GPT-5.5与GPT-5.3-Codex-Spark)、限流策略、状态栏配置等方面提供了具体指导,并介绍了Skill沉淀、Slash命令使用(如/goal、/fork)、Co

本文通过两组实验对Gemma4 12B本地模型的实际能力进行验证。分形树生成实验表明,该模型能完成HTML5 Canvas代码生成任务,但输出质量与prompt精度强相关,需配合Codex进行结果修复。在OpenClaw+QVeris工具链测试中,模型展现出结构化结果解析能力,10个案例成功率100%,但存在工具误选风险。实测显示模型输出速度稳定在83tokens/s,适合作为本地执行单元,但需配

怎样把 Codex、Claude Code、Cursor、gh、lark-cli 这类工具组合起来,让 AI 变成一个可审计、可验证、能交付结果的工作助手。

Codex 以前给我的第一印象,是一个很能干的终端同事:读仓库、改代码、跑测试、查日志,最后把 diff 和结论交回来。最近重新看 Codex App Server,我发现它代表的是另一件事:OpenAI 不只是想把 Codex 放在 CLI、IDE 或桌面 App 里,而是开始把 Codex 的「工作现场」开放给第三方产品接入。

MCP 让 AI 应用接工具变得统一,但工具一旦能读文件、查数据库、发请求,安全问题就从接口规范变成了权限、身份、审计和供应链问题。

Codex 以前给我的第一印象,是一个很能干的终端同事:读仓库、改代码、跑测试、查日志,最后把 diff 和结论交回来。最近重新看 Codex App Server,我发现它代表的是另一件事:OpenAI 不只是想把 Codex 放在 CLI、IDE 或桌面 App 里,而是开始把 Codex 的「工作现场」开放给第三方产品接入。

如果你用 Astro(或其它静态站点)写博客,又运营 微信公众号,多半会遇到同一个痛点:同一篇文章,站点上一套 HTML/CSS,公众号编辑器里又是另一套规则——封面、正文图片、外链、样式都要重新适配。手工复制粘贴几次之后,你一定会想:能不能从已发布的页面自动生成草稿箱里的图文?

想在家里或文印店打印一版证件照,常见需求是:手里只有一张电子版,却要铺满整张相纸(5 寸、6 寸或 A4),还要按 1 寸、2 寸混排。网上工具不少,要么广告多,要么不能自托管。于是干脆从零做了一个开源小项目 zipress:上传一张照片,选纸张和排版模式,导出 300 DPI 的整版图,带裁切辅助线。

想在家里或文印店打印一版证件照,常见需求是:手里只有一张电子版,却要铺满整张相纸(5 寸、6 寸或 A4),还要按 1 寸、2 寸混排。网上工具不少,要么广告多,要么不能自托管。于是干脆从零做了一个开源小项目 zipress:上传一张照片,选纸张和排版模式,导出 300 DPI 的整版图,带裁切辅助线。








