
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文整理自 QCon 全球软件开发大会·2026(北京站)明星讲师蚂蚁集团操作系统研发经理谈鉴锋、高级开发工程师周天昱的演讲分享《From Computer Use to Datacenter Use for AI》。

本文整理自 QCon 全球软件开发大会·2026(北京站)明星讲师蚂蚁集团操作系统研发经理谈鉴锋、高级开发工程师周天昱的演讲分享《From Computer Use to Datacenter Use for AI》。

今天想从底层机制出发,来拆解 Hermes 的多 Agents 逻辑。Hermes 的多 Agents 是一套边界清晰的三层架构:第一层是执行内核:AIAgent。无论外部接入多少种形态的终端,最终负责思考和工具调度的,都是这套底层的运行核心。

多模态模型做题时,最容易骗过人的,不是答错,而是**答案对了,理由却是编的**。比如医学影像问答里,模型最后选对了“肺部不健康”,但中间推理却说“肺野清晰、没有异常”。如果只看最终选项,样本会被当成好数据;如果把推理链读完,就会发现它根本没有认真看图,只是靠语言经验撞上了答案。

很多人在优化 RAG 时,会优先考虑:* 换更强的模型* 调 Prompt* 加更多数据

你让 AI Agent 帮你写一段代码,它做得很好。第二天你让它做一件几乎一样的事,它又从头推理一遍——卡住、报错、重试。就好像它完全没做过上一次。

Function Calling 大概是 LLM 应用开发中最拧巴的一个环节——你让一个概率模型去做一件需要百分之百精确的事。模型生成的自然语言可以有措辞差异、可以有风格变化,用户多半不会在意,但一个工具调用的参数少了一个字段、日期格式从 `YYYY-MM-DD` 变成了 `DD/MM/YYYY`、或者枚举值 `pending` 拼成了 `Pending`,下游系统直接报错,整个 Agent 流程

LLM 在设计上是无状态的。每次 API 调用都是全新开始。你在 ChatGPT 聊天时感觉到的那种"记忆",其实是个幻觉——背后是把整段对话历史在每次请求时全部重新发送一遍。

你做过 FAQ 机器人或者客服 Bot 吗?多半会遇到这个痛苦时刻:* 用户问"帮我退款",关键词匹配到"款",路由进了财务查询链,结果答了一堆账单* 用户问"我的快递在哪",里面有"哪"字,被匹配进了通用知识库,答出来一段配送政策

某省级政务云平台的技术负责人老周,在选 RAG 底座时遇到了一个现实问题:他们有三十万份历史档案扫描件,涵盖1980年代至今的公文、表格、审批表单,格式极其混乱。用户查询时需要精确引用原文,审计部门要求每一句 AI 回答都能回溯到「哪份档案、第几页、哪一段」。








