Agent沙箱实战：Shell工具调用的路径白名单与零信任逃逸审计

2600_96011527

0人浏览 · 2026-05-16 09:21:06

2600_96011527 · 2026-05-16 09:21:06 发布

当本地AI Agent需要操作文件系统或执行Shell命令时，安全工程师最常问的两个问题是："凭什么信任这个工具调用？"和"出问题时怎么追溯？"。本文以OpenClaw默认工具集为例，拆解从权限边界设计到事后审计的全链路关键技术点。

一、Shell工具调用的三重沙箱

OpenClaw的claw-exec模块采用分层防护策略（以v0.8.3为例）：

路径白名单：
工具声明文件(tools.yaml)必须显式标注allowed_paths
违规示例：{tool: git-pull, allowed_paths: [/tmp]} 但实际尝试读写/etc/passwd
运行时校验由ClawGuard模块通过eBPF hook实现
特别处理符号链接：解析最终路径而非链接本身
支持正则表达式匹配（如^/var/log/nginx/.*\.log$）
环境隔离：
每个工具调用生成临时Linux namespace
关键目录(/proc, /sys)挂载为只读
通过clone3系统调用实现（CLONE_NEWNS|CLONE_NEWPID）
限制CPU/core绑定避免资源耗尽攻击
内存限制通过cgroup v2实现（默认256MB/进程）
凭据动态注入：
禁止将API密钥写入磁盘配置文件
通过memfd_create创建临时内存文件描述符
环境变量存活周期≤工具执行时长
敏感操作强制二次确认（如AWS AssumeRole）
密钥轮换事件自动终止关联会话

二、Break-glass机制的设计反模式

当开发者抱怨"我的爬虫Agent需要临时访问外网"时，以下是错误解决方案：

# 反例：直接修改沙箱策略
sudo chmod 777 /opt/clawhub/policy.json

合规流程应包含： 1. 在ClawCanvas工作台提交JIRA式工单 - 必须关联具体业务场景（如"爬取证监会公示数据"） - 需注明预期数据量和目标域名 2. 填写justification字段（最少50字符的工程技术原因） - 禁止使用"测试需要"等模糊表述 - 需说明为何常规白名单无法满足 3. 审批通过后生成临时token（默认有效期15分钟） - 令牌绑定执行者SSH公钥指纹 - 超出范围操作立即触发SIGKILL 4. 操作日志强制关联工单ID（如audit:breakglass-20240520-003） - 日志包含完整的ptrace系统调用记录 - 网络访问需记录TCP/UDP载荷前512字节