x86 个人主页

@x86

x86

2023-04-04 19:25:59 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

AI Gateway 上线之后：推理流量为什么需要自己的网关

这篇文章通过一个客服摘要平台的实际案例，详细拆解了如何在Kubernetes环境下优化AI推理服务的性能问题。作者发现最初将所有请求（在线短摘要和长上下文批处理）混入同一推理池的设计存在严重缺陷——长请求会阻塞短请求，导致客服界面响应缓慢。文章系统性地呈现了解决方案：通过请求分类（基于token数、任务类型）、建立多优先级推理池、改造网关路由策略，并设计了可观测的监控指标。特别强调了实施过程中的关

#算法

Codex 实践问答

本文深入探讨了OpenAI Codex的核心功能与最佳实践。文章首先澄清了Codex作为本地工程协作者（而非简单聊天机器人）的定位，详细对比了其与普通ChatGPT的区别。针对用户常见问题，文章从协作模式选择、模型版本对比（GPT-5.5与GPT-5.3-Codex-Spark）、限流策略、状态栏配置等方面提供了具体指导，并介绍了Skill沉淀、Slash命令使用（如/goal、/fork）、Co

Gemma 4 12B 实战：本地代码生成、OpenClaw 和 QVeris 工具调用

本文通过两组实验对Gemma4 12B本地模型的实际能力进行验证。分形树生成实验表明，该模型能完成HTML5 Canvas代码生成任务，但输出质量与prompt精度强相关，需配合Codex进行结果修复。在OpenClaw+QVeris工具链测试中，模型展现出结构化结果解析能力，10个案例成功率100%，但存在工具误选风险。实测显示模型输出速度稳定在83tokens/s，适合作为本地执行单元，但需配

我怎么用 AI 做真正的工作：从 PR 到文档、远程运维和发布

怎样把 Codex、Claude Code、Cursor、gh、lark-cli 这类工具组合起来，让 AI 变成一个可审计、可验证、能交付结果的工作助手。

#人工智能 #运维

Codex App Server：把编码 Agent 接进自己的工作台

Codex 以前给我的第一印象，是一个很能干的终端同事：读仓库、改代码、跑测试、查日志，最后把 diff 和结论交回来。最近重新看 Codex App Server，我发现它代表的是另一件事：OpenAI 不只是想把 Codex 放在 CLI、IDE 或桌面 App 里，而是开始把 Codex 的「工作现场」开放给第三方产品接入。

MCP 真正要补的课：不是接上工具，而是画清安全边界

MCP 让 AI 应用接工具变得统一，但工具一旦能读文件、查数据库、发请求，安全问题就从接口规范变成了权限、身份、审计和供应链问题。

#安全 #MCP

Codex App Server：把编码 Agent 接进自己的工作台

astro-to-wechat：把 Astro 博文同步到微信公众号草稿的开源小工具

如果你用 Astro（或其它静态站点）写博客，又运营微信公众号，多半会遇到同一个痛点：同一篇文章，站点上一套 HTML/CSS，公众号编辑器里又是另一套规则——封面、正文图片、外链、样式都要重新适配。手工复制粘贴几次之后，你一定会想：能不能从已发布的页面自动生成草稿箱里的图文？

从 0 到 1：用 Cursor 搭一个开源证件照排版服务 zipress

想在家里或文印店打印一版证件照，常见需求是：手里只有一张电子版，却要铺满整张相纸（5 寸、6 寸或 A4），还要按 1 寸、2 寸混排。网上工具不少，要么广告多，要么不能自托管。于是干脆从零做了一个开源小项目 zipress：上传一张照片，选纸张和排版模式，导出 300 DPI 的整版图，带裁切辅助线。

#开源

从 0 到 1：用 Cursor 搭一个开源证件照排版服务 zipress

#开源

共 21 条

请选择