
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文在 [Decoder-only Transformer]、[LLaMA 架构]、[DeepSeek LLM]、[DeepSeekMoE] 与 [DeepSeek-V2] 的基础上,系统介绍 **DeepSeek-V3** 的技术报告要点。V3 延续 **Multi-head Latent Attention(MLA)** 与 **DeepSeekMoE** 作为注意力与稀疏 FFN 的核心设计

多 Agent 并非简单地"启动多个 LLM 线程"——它更像在一个常驻 Gateway 进程内,同时运行多个**相互隔离的工作空间(workspace)+ 状态目录(agentDir)+ 会话存储(sessions)**。本文从 OpenClaw 的配置与源码出发,阐明 `agents.list` 与 `bindings` 如何共同定义"隔离边界"与"路由确定性",并通过一条端到端的入站链路解析

当主 Agent 需要并行处理耗时任务或将工作委托给"助手"时,OpenClaw 提供了**子 Agent(Sub-Agent)**机制。本文深入解析 `sessions_spawn` 的完整生命周期:子 Agent 如何在独立的 session 中运行(`agent:<agentId>:subagent:<uuid>`),为何只能**向父 Agent 汇报**而非对等通信,以及当前架构的**设计

摘要 本文首次提出间接提示注入攻击(IPI),揭示了大型语言模型(LLM)集成应用的安全隐患。攻击者通过污染外部数据(如网页、文档)嵌入恶意指令,当AI检索这些数据时,指令被间接执行,导致AI行为被劫持。论文构建了系统性威胁分类体系,包括信息收集、欺诈、入侵等六类攻击,并在Bing Chat等真实系统中验证了攻击可行性。实验表明,攻击者可利用AI的权威性诱导用户点击恶意链接、泄露隐私或建立持久后门

在LLM系统中,Context Window 既是数据存储区,也是代码执行区。当用户输入、检索文档、工具返回结果和系统指令共处同一上下文时,任何内容都可能改变模型行为。缺乏有效隔离的代价不是简单的"答错题",而是跨租户数据泄露、敏感信息回显、提示注入攻击,以及缓存共享带来的侧信道风险。

摘要(149字): 斯坦福与伯克利团队研究发现,语言模型处理长上下文时存在显著的"U型性能曲线"——对开头和结尾信息敏感,中间信息易被忽略(arXiv:2307.03172)。实验显示,当关键信息位于文档中间时,GPT-3.5等模型的准确率比随机猜测更低,且上下文越长衰减越严重。这种"迷失现象"源于注意力机制偏差与训练数据分布,尤其在Decoder-only

摘要 本文详解Google Research提出的Vision Transformer(ViT)架构,该模型将图像切分为固定大小的patch序列,通过线性投影和位置编码处理后直接输入标准Transformer编码器进行分类。文章重点分析了ViT与CNN在归纳偏置上的本质差异,阐释了ViT依赖大规模预训练的原因,并讨论了patch尺寸与计算效率的关系。作为视觉Transformer的基础模型,ViT

摘要:本文探讨如何在系统提示(system prompt)中明确定义AI助手的能力边界,以减少误用工具和产生幻觉的情况。能力边界应包含四方面内容:(1)业务事实必须来自工具返回;(2)明确禁止项(如高危操作需二次确认);(3)推荐决策顺序(先只读后写);(4)与已注册工具列表保持一致。通过对比极简和详细两种system写法,说明清晰的能力边界可降低越权和幻觉调用的概率,但仍需配合执行层的硬性校验机

摘要:本文探讨如何在系统提示(system prompt)中明确定义AI助手的能力边界,以减少误用工具和产生幻觉的情况。能力边界应包含四方面内容:(1)业务事实必须来自工具返回;(2)明确禁止项(如高危操作需二次确认);(3)推荐决策顺序(先只读后写);(4)与已注册工具列表保持一致。通过对比极简和详细两种system写法,说明清晰的能力边界可降低越权和幻觉调用的概率,但仍需配合执行层的硬性校验机

摘要(150字) 本文探讨API版本管理与演进策略,特别关注LLM场景下的"契约漂移"问题。核心观点:1) API版本应明确标识在URL路径中(如/v1/),便于人和机器识别;2) 修改分为三类:安全扩展、行为变更和破坏性变更,后者需创建新版本路径;3) 使用Sunset、Deprecation等标准响应头实现机器可读的版本生命周期管理;4) 强调代码、文档、工具描述等资产需同








