GitHub_Trending/skills23/skills API完全解析:解锁AI浏览工具的无限可能

【免费下载链接】skills Claude Agent SDK with a web browsing tool 【免费下载链接】skills 项目地址: https://gitcode.com/GitHub_Trending/skills23/skills

GitHub_Trending/skills23/skills是一款强大的Claude Agent SDK,集成了高效的网页浏览工具,为开发者提供了构建智能自动化浏览应用的完整解决方案。通过其丰富的API接口,你可以轻松实现网页导航、元素交互、内容提取和自动化测试等功能,让AI驱动的浏览体验变得前所未有的简单高效。

核心功能概览:为什么选择skills23/skills API?

skills23/skills API为AI浏览工具带来了革命性的突破,主要体现在以下几个方面:

  • 多模态交互能力:不仅支持传统的文本交互,还能通过视觉识别和空间定位实现精准的页面操作
  • 灵活的环境配置:同时支持本地浏览器和Browserbase云浏览器两种运行模式,满足不同场景需求
  • 完整的工具链支持:从基础的页面导航到复杂的表单填写,提供全方位的浏览器控制功能
  • 详细的追踪机制:自动记录每次运行的详细日志和截图,便于调试和分析

快速入门:从零开始使用skills23/skills API

环境准备与安装步骤

要开始使用skills23/skills API,首先需要准备好开发环境并完成安装:

  1. 克隆项目仓库

    git clone https://gitcode.com/GitHub_Trending/skills23/skills
    cd skills23/skills
    
  2. 安装依赖

    npm install
    
  3. 配置环境变量: 创建.env文件并添加必要的API密钥:

    ANTHROPIC_API_KEY=your_claude_api_key
    BROWSERBASE_API_KEY=your_browserbase_api_key  # 远程模式需要
    BROWSERBASE_PROJECT_ID=your_project_id        # 远程模式需要
    

第一个示例:简单网页浏览

以下是一个使用browse命令行工具浏览网页的基本示例:

# 启动浏览器并打开网页
browse open https://example.com

# 获取页面标题
browse get title

# 截取页面截图
browse screenshot example.png

# 关闭浏览器
browse stop

这个简单的流程展示了skills23/skills API的基本使用方式,通过直观的命令即可完成一系列浏览器操作。

核心API详解:掌握浏览工具的强大功能

浏览器自动化API(browser/REFERENCE.md)

浏览器自动化是skills23/skills的核心功能,提供了丰富的命令来控制浏览器行为。主要包括以下几类操作:

导航控制
  • open :打开指定URL,支持等待页面加载完成的多种策略

    # 等待网络空闲后再继续(适合单页应用)
    browse open https://example.com --wait networkidle
    
  • reload:重新加载当前页面

  • back/forward:在浏览历史中前进或后退

页面状态获取
  • snapshot:获取页面的可访问性树,包含交互元素引用

    # 获取紧凑格式的页面结构快照
    browse snapshot --compact
    
  • get [selector] :获取页面属性,如URL、标题、文本内容等

    # 获取特定元素的文本内容
    browse get text ".product-description"
    
  • screenshot [path]:捕获页面截图,支持全屏截图

    # 捕获整个页面的截图
    browse screenshot --full-page
    
元素交互
  • click :通过元素引用点击页面元素

    # 点击引用为@0-5的元素
    browse click @0-5
    
  • fill :填充表单字段

    # 填充搜索框并提交
    browse fill "#search-input" "AI浏览工具"
    
  • type :在当前焦点元素中输入文本,支持模拟人类输入

    # 模拟人类打字,包含自然错误
    browse type "Hello World" --mistakes
    

搜索API(search/REFERENCE.md)

search API提供了强大的网络搜索功能,能够返回结构化的搜索结果:

基本用法
curl -X POST "https://api.browserbase.com/v1/search" \
  -H "X-BB-API-Key: $BROWSERBASE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"query": "AI浏览器自动化", "numResults": 5}'
响应格式

成功的搜索请求将返回包含以下信息的JSON响应:

  • requestId:搜索请求的唯一标识符
  • query:执行的搜索查询
  • results:搜索结果数组,每个结果包含URL、标题、作者、发布日期等信息

自动化评估API(autobrowse/REFERENCE.md)

autobrowse提供了评估自动化任务的能力,通过evaluate.mjs脚本可以运行和评估复杂的浏览任务:

基本命令格式
node ${CLAUDE_SKILL_DIR}/scripts/evaluate.mjs --task <name> [options]
主要参数
  • --task <name>:任务名称,对应tasks/ /目录
  • --env local|remote:运行环境,本地或远程浏览器
  • --model <model>:使用的Claude模型,如claude-sonnet-4-6
输出文件

每次运行后,结果将保存到traces/<task>/run-NNN/目录,包括:

  • summary.md:包含持续时间、成本、决策日志和最终输出
  • trace.json:完整的工具调用日志
  • screenshots/:运行过程中的截图

实际应用场景:skills23/skills API的无限可能

网页数据提取与分析

利用skills23/skills API,你可以轻松构建网页数据提取工具,自动收集和分析网络信息:

# 打开目标网页
browse open https://example.com/products

# 获取产品列表
browse get text ".product-list"

# 提取所有产品链接
browse eval "Array.from(document.querySelectorAll('.product a')).map(a => a.href)"

自动化测试与监控

skills23/skills非常适合构建自动化测试和监控工具,确保网页功能正常运行:

# 打开登录页面
browse open https://example.com/login

# 填写登录表单
browse fill "#username" "testuser"
browse fill "#password" "testpass"
browse click @0-12  # 点击登录按钮

# 验证登录是否成功
browse wait "selector" ".dashboard"
browse get text ".welcome-message"

智能浏览助手

结合Claude的AI能力,skills23/skills可以构建智能浏览助手,自动完成复杂的浏览任务:

# 使用特定模型运行自定义任务
node scripts/evaluate.mjs --task research-topic \
  --model claude-opus-4-6 \
  --env remote

高级技巧与最佳实践

环境选择策略

根据不同需求选择合适的运行环境:

  • 本地模式:适合开发调试和简单任务,不需要网络连接

    browse env local
    
  • 远程模式:适合生产环境和需要持久化状态的任务

    browse env remote
    

错误处理与调试

skills23/skills提供了完善的错误处理机制,常见问题及解决方法:

  • "No active page":确保先运行browse open <url>打开页面
  • 元素引用未找到:重新运行snapshot获取最新的元素引用
  • 超时错误:使用browse wait命令增加等待时间

性能优化

为提高自动化任务的性能,建议:

  • 优先使用snapshot而非screenshot获取页面信息
  • 合理选择模型,简单任务使用claude-haiku-4-5-20251001
  • 使用--compact选项减少数据传输量

总结:开启AI浏览自动化的新篇章

GitHub_Trending/skills23/skills API为开发者提供了构建强大AI浏览工具的完整解决方案。通过其直观的命令行接口和丰富的功能集,你可以轻松实现从简单网页浏览到复杂自动化任务的各种需求。无论是数据提取、自动化测试还是智能助手,skills23/skills都能为你的项目带来前所未有的效率和可能性。

现在就开始探索skills23/skills的无限潜力,构建属于你的AI浏览工具吧!更多详细信息和示例,请参考项目中的各个参考文档,如browser/REFERENCE.mdsearch/REFERENCE.mdautobrowse/REFERENCE.md

【免费下载链接】skills Claude Agent SDK with a web browsing tool 【免费下载链接】skills 项目地址: https://gitcode.com/GitHub_Trending/skills23/skills

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐