zavoryn 个人主页

@qq_62915969

zavoryn

2026-05-15 19:42:24 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

从王鹤棣直播间 500 万点赞说起：Java 后端如何扛住热点互动洪峰？

2026 年 5 月 24 日，王鹤棣雅迪品牌直播间公开报道中出现 10 万+ 在线、500 万+ 点赞的互动数据。本文不讨论娱乐事件本身，而是借这个真实高并发场景，拆解 Java 后端如何设计点赞幂等、Kafka 异步计数、Caffeine + Redis + MySQL 三级缓存、单飞锁和计数重建自愈。

#java #后端 #架构

Chroma 迁移 Milvus 实战：Schema、双写、校验与无损切流

Chroma 到 Milvus 的迁移不是替换连接串，而是把 ID、Embedding、Metric、Metadata、Chunk 和 Query 六类隐式契约显式化。本文给出一套可落地方案：Milvus Schema 设计、快照回填、线上双写、Checkpoint、Hash 与检索校验、Shadow Query、Collection Alias 切流和快速回滚。

#RAG #milvus

Word 图片如何进入 RAG：Apache POI、MinIO 与 URL 映射

Word 图片进入 RAG 不能只导出二进制。本文使用 Apache POI 在 Paragraph/Run 中保持图片锚点，通过 SHA-256 内容寻址上传 MinIO，Markdown 保存稳定 `asset://id`，由 Asset Resolver 按 tenant/ACL 生成短期 URL，并处理 MIME、缓存、版本、共享引用和延迟回收。

#RAG

从聊天框到工作流：理解 AI Agent 人机协作的下一次升级

本文从聊天式 Agent 的局限讲起，解释为什么复杂 Agent 工作需要任务树、状态管理、异步审查、权限边界、回滚机制和可验证指标。文章结合 MCP、A2A、OpenAI Codex Harness、LangGraph durable execution 与 Legora Workflows 等资料，给出一套开发者可落地的 Agent 工作流设计框架。

#人工智能 #架构

后端接入 AI Agent：Tool Calling 网关、幂等与审计日志实战

AI Agent 能发起 Tool Call，不代表它应该直接碰业务接口。真正可上线的 Java 后端，需要在模型和业务系统之间加一层 Tool Calling 网关，把工具注册、权限校验、幂等、超时、审计日志和错误回填都收住。本文结合 Spring AI、LangChain4j、OpenAI、Anthropic 的官方 Tool Calling 设计，以及 DDIA 里的可靠性、事务和分布式故障

#java #后端 #人工智能

Python 并发八股：线程、进程、协程和 asyncio 到底怎么选？

拆解 Python 并发模型：线程适合 IO 等待，进程适合 CPU 并行，asyncio 适合高并发网络 IO，FastAPI 里还要分清 `def`、`async def` 和阻塞代码的边界。

#python #开发语言 #后端

AI Agent 为什么会跑偏：目标漂移、上下文污染和工具诱导

Agent 跑偏不是简单的“模型幻觉”。在一个会读上下文、会拆任务、会调用工具、会把工具结果继续写回上下文的系统里，小误差会沿着行动链不断放大。本文用目标漂移、上下文污染和工具诱导三个概念，解释为什么 Agent 明明一开始听懂了，却会在执行过程中慢慢偏离原始意图。

#人工智能 #后端 #算法

从王鹤棣直播间 500 万点赞说起：Java 后端如何扛住热点互动洪峰？

#java #后端 #架构

Python 底层面试必会：先搞懂对象、引用和 GIL

很多 Java 后端转 Python 时，会觉得 Python “语法简单”，但一到面试就卡在对象模型、可变对象、装饰器、生成器、GIL、协程和内存管理上。本文按面试高频问题梳理 Python 底层知识，并穿插 Java 到 Python 的迁移视角，帮助你为后续 FastAPI 和 AI Agent 后端打基础。

#python #面试 #开发语言

Python 面试高频：装饰器、迭代器、生成器和上下文管理器一次讲清

Python 基础高频点：装饰器、闭包、迭代器、生成器和上下文管理器。这几个知识点看起来像语法技巧，其实是理解 Python 框架、FastAPI 路由、依赖管理、流式返回和资源释放的基础。

#python #面试 #开发语言

共 48 条

请选择