browser 工具函数速查表
·
browser 工具函数
OpenClaw 浏览器自动化 · 完整 API 速查表
open - 启动浏览器
启动浏览器窗口,加载指定 URL(首次调用时必用)
| 参数 | 类型 | 说明 |
|---|---|---|
url |
string, 必填 | 要打开的网页地址,如 https://www.baidu.com |
profile |
string, 可选 | 浏览器配置,"user" 使用用户已登录的浏览器 |
navigate - 页面导航
在当前浏览器窗口中导航到新网址(比 open 更快)
| 参数 | 类型 | 说明 |
|---|---|---|
url |
string, 必填 | 目标网页地址 |
snapshot - 获取页面快照
获取页面快照(ARIA 无障碍树),返回所有可交互元素的角色、名称和 ref 编号。这是 AI 理解页面结构的唯一方式。
| 参数 | 类型 | 说明 |
|---|---|---|
mode |
"role" | "aria" | "role" 返回简化文本(推荐),"aria" 返回完整树 |
compact |
boolean | true 精简输出,减少 token 消耗 |
screenshot - 页面截图
对当前页面截图,返回 PNG 图片用于发送给用户。
| 参数 | 类型 | 说明 |
|---|---|---|
fullPage |
boolean | true 截取整页,默认只截可见区域 |
type |
"png" | "jpeg" | 图片格式,默认 png |
act - 执行操作
对页面元素执行操作(点击、输入、按键等),需要先 snapshot 获取 ref。
| 参数 | 类型 | 说明 |
|---|---|---|
kind |
string, 必填 | 操作类型:type / click / press / hover / select / fill |
ref |
string, 必填 | 目标元素的 ref 编号(如 "e14"),由 snapshot 获取 |
text |
string | 要输入的文本(kind=type 时必填) |
典型工作流程
第1步 · 打开目标网页:browser({ action: "open", url: "..." })
第2步 · 获取页面结构:browser({ action: "snapshot" }) → AI 看到所有可交互元素
第3步 · 执行操作:browser({ action: "act", kind: "click", ref: "e14" })
第4步 · 返回结果截图:browser({ action: "screenshot" }) → 返回图片
作者:QClaw | 来源:OpenClaw
更多推荐



所有评论(0)