OpenCLI:让 AI 接管你的浏览器、桌面软件。


直接看结果


📊 一键获取多社交、内容平台热榜


每天早上,你可能需要打开知乎刷热榜、去微博看热搜、再到B站看看热门视频。

数个平台,挨个看下来,少则几分钟,多则一小时。

现在,一行命令就能搞定:

获取小红书推荐内容
opencli xiaohongshu feed

获取B站热门视频
opencli bilibili hot

知乎热榜
opencli zhihu hot

Hacker News 热门文章
opencli hackernews top

当然也支持微博、Reddit、Twitter 等等你经常访问的网站。

几秒钟就能拿到所有平台的热点信息。

还能回复推文、点赞、收藏、关注取关、删推。全部命令化,一句话搞定。

不光社交平台,求职招聘网站也支持。
搜索 Boss 直聘上的职位
opencli boss search “ai 开发 产品"


🖥️ 控制桌面应用

除了能操控网站,它还能直接控制桌面上 AI 应用。

目前流行的 Vibe Code 软件 Cursor,Codex,笔记软件 Notion,社交软件 Discord,还有中国的豆包 doubao,都支持控制。

OpenCLI 是什么


OpenCLI 是一个开源命令行工具,目前在 GitHub 上已有 7.3k 颗星。

它能把任何网站或桌面应用,变成你可以在终端里直接操作的命令。

它的核心思路很巧妙:

直接连接你电脑上已经打开的 Chrome 浏览器,复用你浏览器里已经登录好的会话状态

你在浏览器里登了知乎,OpenCLI 就直接借用这个登录状态去操作。

不需要申请任何 API,不需要开发者权限,密码也不会存在任何地方。

所以你在本地电脑能访问的网站,它都可以无缝丝滑的访问。

这一点就解决了之前我在 WorkBuddy 里面尝试使用浏览器自动化技能来搜索 Boss 直聘网站的问题:网站有反自动化的机制。

当时 Agent 使用了 playwright-cli(也是一个无头浏览器的命令行工具)尝试了10多轮。

但是遇到了网站的反自动化:

BOSS 直聘的 JS 在检测到自动化环境后,主动执行了 location.href = "about:blank" 跳转。

最终也是放弃了这个方案。

OpenCLI 核心特点


🎯 零风险


复用 Chrome 登录态,无需存储任何凭证。你的账号安全完全由你自己掌控。

🔌 多站点覆盖

覆盖 B站、知乎、小红书、Twitter、Reddit、YouTube 等多个平台,以及 gh、docker 等多种工具。

列表太长,不一一贴在这里,你可以安装上后,慢慢查看。

🤖 AI 原生

explore自动发现 API,synthesize生成适配器,cascade探测认证策略。专为 AI Agent 打造。

⚡ 零 LLM 成本

运行时不消耗任何 token,跑一万次不花一分钱。

你会命令行的话,可以直接在命令行执行。

如果让龙虾执行,也是对 token 友好,因为大模型只需要执行命令,获取结果,省去了中间过程需要大量消耗的 token。

下面进入保姆级的安装步骤讲解,以 WorkBuddy 为例,其他 OpenClaw  也可以照搬使用。

安装步骤


仓库地址:https://github.com/jackwener/opencli/

直接对要求小龙虾按地址进行安装:


安装这个仓库技能:https://github.com/jackwener/opencli

首先经过安全技能skill-vetter的审核

这一步很重要,能够让你的小龙虾更安全,没有这个技能,相当于在这个AI+联网的时代裸奔,数据分分钟就泄露到互联网。

审计通过,风险等级低。开始安装:


安装完成,显示可用的公开命令。


如果要发挥它的最大作用,还需要继续安装 Chrome 扩展,使用 Brower命令。


点开 GitHub Releases 连接下载压缩包,然后在 Chrome 的扩展程序中安装。


点击 Chrome 最右上角三个竖点,再点击“扩展程序”,点击“管理扩展程序”。


点击“加载未打包的扩展程序”,选中刚刚下载压缩包解压后的地址。


安装完成后,“所有扩展程序”中显示 OpenCLI 就算完成。


把 Chrome 浏览器重新打开之后,再回到 WorkBuddy 让它试试是否可以操作。


opencli Browser Bridge扩展已经启用,检查桥接状态

查看所有命令
至此,全部安装工作已经完成,使用下面命令查看它都能干啥:
opencli list
反正我看着它滚动两屏幕才显示完的命令,里面支持的网站,感觉耗子掉进了米仓,军迷进了军火库。

为什么选择 OpenCLI


这个表格是官方做的与其他工具的对比,顺便贴在这里给你参考。

你的需求

最佳工具

原因

定时从特定站点提取结构化数据

opencli

预定义适配器,确定性 JSON 输出,零 LLM 成本

AI Agent 需要可靠的站点操作

opencli

数百条命令,结构化输出,快速确定性响应

临时探索未知网站

Browser-Use、Stagehand

LLM 驱动的通用浏览,适合一次性任务

大规模网页爬取

Crawl4AI、Scrapy

专为吞吐量和规模设计

从终端控制桌面 Electron 应用

opencli

CDP + AppleScript,目前唯一能做到这一点的 CLI 工具


核心优势


  • 零 LLM 成本— 运行时不消耗任何 token,跑一万次不花一分钱

  • 确定性— 同一命令永远返回同一结构,可管道化、可脚本化、CI 友好

  • 覆盖广泛— 50+ 站点,横跨全球与中国平台

  • 绕过反爬— 复用浏览器登录态,无需担心验证码和IP封禁


CLI 是未来软件交互的核心


写到这里,想起之前看到 AI 专家 Andrej Karpathy 的观点:

一切软件,都将为 Agent 重写

过去 40 年,软件行业的核心是发明图形用户界面(GUI),将计算机的 API/CLI/HTTP 请求"翻译"成人类能理解的按钮、菜单。

这层"翻译"做得越来越精美。

Agent 时代的到来改变了一切。

AI Agent 天生就会写代码、调 API、发 HTTP 请求。

GUI 这层"翻译"对它来说反而是障碍,它需要先理解页面结构、模拟点击、等待加载、解析结果。

这就像请了一位精通英语的翻译,却非要跟他说中文,让他再翻译回英语去沟通。

未来的软件必须 "API-first",或者说 "CLI-first"。

我们花了 40 年给计算机加上的人类翻译层(GUI),现在要退回去,直接为 Agent 提供机器原生语言(API/CLI)。

市场也在发生变化:人类选软件的非理性因素(如 UI 好看、营销)将失效。

Agent 市场接近完全竞争,软件护城河将转向 API 质量、数据独占性与性价比。

所以,现在开发的趋势应该是为 Agent 设计简洁高效的 API/CLI 接口,完善文档与稳定性,同时探索按量计费及 Agent 自主支付等适配模式。

刚要发布这篇文章,得知飞书官宣 CLI 开源,做出了选择。

感兴趣的可以看看:https://github.com/larksuite/cli

谁会适应AI的时代?

欢迎评论区留言。

-END-

推荐阅读:

让OpenClaw替你打工(五):没花什么钱养了6只虾,还赚到了钱

让 OpenClaw 帮你干活(四):Proactive Agent 技能让AI眼里有活

OpenClaw + Obsidian:最小成本搭建 AI 记忆同步系统

OpenClaw 为什么总“失忆”?双层记忆 + 三层防御,让它真正记住你

给 OpenClaw 接入10000+工具和数据,为你盯盘,给出独家策略

让你的OpenClaw替你打工:从0到1跑通小红书运营全流程(实战教程)

OpenClaw 入门指南、使用技巧和常见错误排查及解决

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐