Leesz123 个人主页

提示词注入是 LLM 应用特有的攻击面，但它不是不可防御的。纵深防御：不依赖单一防线，输入检测 + 架构隔离 + 输出过滤 + 监控告警，多层叠加零信任：用户输入和外部内容都是不可信的，在到达模型前必须经过隔离和校验最小权限：Agent 的工具调用范围尽可能小，参数尽可能严可观测：全链路日志 + 异常检测 + 告警，确保攻击发生时能快速发现和响应提示词注入防御不是一次性的工作，而是一个持续对抗的过

Human-in-the-loop 是什么：让 AI Agent 可控、可靠、可迭代的人机协同实践指南

Human-in-the-loop 的本质，是在人和 AI 之间建立清晰分工：AI 负责高频、重复、可计算的部分，人负责目标判断、风险把关、价值选择和最终责任。对 AI Agent 来说，HITL 应该被当作产品架构的一部分，而不是上线后的补救措施。一个成熟的人在回路设计，至少要包含任务风险分级、关键暂停点、人工确认机制、结构化反馈和可观测日志。当我们讨论 AI 是否能替代人时，更现实的问题其实是

大模型算法工程师面试题精讲（三）：模型推理优化高频15问

大模型从训练到上线，推理优化是算法工程师必须跨越的最后一公里。无论模型多强，推理延迟、显存占用、吞吐量直接决定了产品体验和部署成本。本篇整理推理优化方向 15 道高频面试题，覆盖 KV Cache、量化、解码加速、调度服务化等核心主题，帮助你在面试中从容应对。PagedAttention 是 vLLM 提出的注意力机制，灵感来自操作系统的虚拟内存分页机制。传统 KV Cache 的痛点在于显存碎片

#算法 #人工智能 #面试

大模型算法工程师面试题精讲（三）：模型推理优化高频15问

#算法 #人工智能 #面试

Function Calling 与 MCP：Agent 工程中的工具调用边界与协议选择

本文面向 AI Agent 应用开发者、产品经理与架构师，从工程视角拆解 Function Calling 与 MCP 的核心差异：前者更像模型侧的函数调用契约，适合单应用内工具编排；后者更像 Agent 与外部能力系统之间的上下文协议，适合跨系统、跨团队、可治理的工具生态。

Spec Coding 和 Vibe Coding 的区别：AI Coding 从感觉驱动到规格驱动

本文系统拆解 Spec Coding 和 Vibe Coding 的区别：Vibe Coding 适合快速探索、原型验证和边试边改，Spec Coding 更适合复杂功能、团队协作和生产交付。文章从定义、适用场景、验收标准、规格模板和落地流程出发，帮助开发者建立先探索再按规格交付的 AI Coding 工作流。

Loop Engineering 是什么：让 AI Agent 从一次性回答变成可迭代执行

可以把 Loop Engineering 定义为：面向 AI Agent 和自动化系统的反馈闭环设计方法，通过状态管理、工具执行、外部观察、评估信号、纠错策略和停止条件，让模型从“一次性生成”升级为“可迭代完成任务”。任务怎么拆成多轮步骤；每一轮执行后如何判断结果；失败后应该重试、换策略、降级，还是问人；什么情况下必须停止；如何避免 Agent 自己陷入无限循环。目标 → 计划 → 执行 → 观察