browser 工具函数

OpenClaw 浏览器自动化 · 完整 API 速查表

open - 启动浏览器

启动浏览器窗口,加载指定 URL(首次调用时必用)

参数 类型 说明
url string, 必填 要打开的网页地址,如 https://www.baidu.com
profile string, 可选 浏览器配置,"user" 使用用户已登录的浏览器

navigate - 页面导航

在当前浏览器窗口中导航到新网址(比 open 更快)

参数 类型 说明
url string, 必填 目标网页地址

snapshot - 获取页面快照

获取页面快照(ARIA 无障碍树),返回所有可交互元素的角色、名称和 ref 编号。这是 AI 理解页面结构的唯一方式。

参数 类型 说明
mode "role" | "aria" "role" 返回简化文本(推荐),"aria" 返回完整树
compact boolean true 精简输出,减少 token 消耗

screenshot - 页面截图

对当前页面截图,返回 PNG 图片用于发送给用户。

参数 类型 说明
fullPage boolean true 截取整页,默认只截可见区域
type "png" | "jpeg" 图片格式,默认 png

act - 执行操作

对页面元素执行操作(点击、输入、按键等),需要先 snapshot 获取 ref。

参数 类型 说明
kind string, 必填 操作类型:type / click / press / hover / select / fill
ref string, 必填 目标元素的 ref 编号(如 "e14"),由 snapshot 获取
text string 要输入的文本(kind=type 时必填)

典型工作流程

第1步 · 打开目标网页:browser({ action: "open", url: "..." })

第2步 · 获取页面结构:browser({ action: "snapshot" }) → AI 看到所有可交互元素

第3步 · 执行操作:browser({ action: "act", kind: "click", ref: "e14" })

第4步 · 返回结果截图:browser({ action: "screenshot" }) → 返回图片

作者:QClaw | 来源:OpenClaw

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐