开发者模式怎么开?Open-AutoGLM手机设置教学

你是不是也刷到过那条爆火的测试视频——AI直接在手机上点开小红书、搜索“咖啡探店”,自动滑动浏览笔记,再精准点击收藏?不是录屏,不是脚本,而是真正在“看”屏幕、“想”步骤、“动手”操作。这背后,正是智谱开源的 Open-AutoGLM —— 一个能让手机自己“长脑子”的 AI Agent 框架。

它不依赖 App 内置接口,不越狱不 Root,只靠一张实时截图 + 一条自然语言指令,就能完成从打开应用、输入关键词、筛选结果到点击关注的整套动作。而这一切的前提,是你的手机得先“被看见”、能“被指挥”。换句话说:开发者模式和 ADB 调试,是通往手机智能体的第一道门禁

本文不讲大模型原理,不堆参数配置,就专注一件事:手把手带你把安卓手机调成 Open-AutoGLM 可识别、可操控的状态。从“设置里找不到开发者选项”到“adb devices 显示 device”,全程无跳步、无黑话、无玄学,连第一次用命令行的新手也能照着做通。


1. 为什么必须开开发者模式?这不是个“高级功能”,而是“通信通道”

很多人以为开发者模式只是给程序员用的彩蛋,其实它本质是安卓系统的一扇“后门”。没有它,电脑根本无法向手机发送任何底层指令——就像你想遥控一台电视,但电视没接红外接收器,按烂遥控器也没用。

Open-AutoGLM 的工作流非常清晰:

  • :每秒截取手机屏幕画面,传给视觉语言模型(VLM)分析
  • :模型理解当前界面(比如“这是微信登录页,有手机号输入框和验证码按钮”)
  • :通过 ADB 向手机下达操作指令(如“点击坐标 (520, 840)”或“输入文字 ‘138****1234’”)

而 ADB(Android Debug Bridge)这个工具,只有在开发者模式开启且 USB 调试启用后,才能与手机建立可信连接。它不是普通 App,而是系统级通信协议。所以,“开开发者模式”不是可选项,而是启动整个 AI 手机助理的必要前置动作


2. 三步搞定手机端设置:从“找不到入口”到“adb devices 显示设备”

别担心“关于手机”在哪、“版本号”点几次——不同品牌路径略有差异,但逻辑完全一致。我们按最通用、最稳妥的方式操作,覆盖华为、小米、OPPO、vivo、三星等主流机型。

2.1 开启开发者模式:连续点击“版本号”,不是“编译号”也不是“内核版本”

  • 打开手机 设置 → 关于手机(部分机型叫“我的设备”“系统信息”)
  • 找到 “版本号”(注意:不是“编译号”“内核版本”“安全补丁日期”)
  • 连续快速点击该行 7 次(系统会弹出提示:“您已处于开发者模式”或“再点 X 次开启”)
  • 成功标志:返回上一级,能看到新增的 “开发者选项” 菜单项

小贴士:如果点完没反应,检查是否开启了“简易模式”或“老年模式”,这些模式会隐藏深层设置;另外确认手机系统已更新至 Android 7.0 或更高版本(2016 年后发布的机型基本都满足)。

2.2 启用 USB 调试:这是 ADB 连接的“钥匙”

  • 进入新出现的 “开发者选项”
  • 往下找到 “USB 调试”(部分机型显示为“USB 调试(安全设置)”或“ADB 调试”)
  • 打开开关(首次开启会弹出授权提示,勾选“始终允许”并点确定)
  • 成功标志:电脑用 USB 线连接后,在命令行输入 adb devices,能列出设备 ID(如 ABC123456789 device

注意:某些品牌(如华为、小米)还有额外一步——在“开发者选项”中找到 “USB 调试(安全设置)”“仅充电模式下允许 ADB 调试”,也需一并开启,否则 USB 连接时可能显示 unauthorized

2.3 安装并启用 ADB Keyboard:让 AI 能“打字”,不只是“点按”

Open-AutoGLM 不仅能模拟点击,还能自动输入文字(比如搜索关键词、填写账号密码)。但安卓默认输入法无法被 ADB 直接控制,必须换一个“听命令”的键盘。

  • 下载 ADB Keyboard APK(官方推荐版本见 GitHub README,也可搜索“ADB Keyboard GitHub”获取最新 release)
  • 用电脑传输到手机,或用手机浏览器直接下载安装(安装前需在 设置 → 安全 → 未知来源应用安装 中,允许该浏览器安装应用)
  • 安装完成后,进入 设置 → 语言与输入法 → 虚拟键盘 / 当前输入法
  • 找到 “ADB Keyboard” 并启用(部分机型需点击右侧开关,或长按“管理键盘”添加)
  • 成功标志:在任意输入框点击唤起键盘时,顶部状态栏显示 “ADB Keyboard” 字样

关键验证:回到桌面,长按任意 App 图标 → 选择“编辑” → 点击名称输入框,尝试用语音或手写输入。如果能正常输入,说明 ADB Keyboard 已接管,AI 后续就能替你敲字了。


3. 电脑端环境准备:装好 ADB,让它“认得”你的手机

手机端设好了,电脑端也得配齐“翻译官”——ADB 工具。它负责把 Python 脚本里的指令(如 click(500, 800)),翻译成安卓系统能听懂的底层命令。

3.1 下载并配置 ADB(Windows/macOS 通用)

  • Android SDK Platform-Tools 官网 下载最新版 ZIP 包(Windows 选 windows.zip,macOS 选 macos.zip

  • 解压到一个固定路径,例如:

    • Windows:C:\platform-tools
    • macOS:~/Downloads/platform-tools
  • 配置环境变量(让系统 anywhere 都能识别 adb 命令)

    • Windows
      1. Win + R 输入 sysdm.cpl → “高级” → “环境变量”
      2. 在“系统变量”中找到 Path → “编辑” → “新建” → 粘贴你的解压路径(如 C:\platform-tools
      3. 点击“确定”保存,重启命令行窗口
    • macOS
      1. 打开 Terminal,运行:
        echo 'export PATH=$PATH:~/Downloads/platform-tools' >> ~/.zshrc
        source ~/.zshrc
        
      2. 输入 adb version 验证,应显示类似 Android Debug Bridge version 1.0.41

3.2 验证连接:一次成功的 adb devices 就是通行证

  • 用原装 USB 数据线将手机连接电脑(确保手机屏幕已点亮)

  • 在电脑命令行输入:

    adb devices
    
  • 正常输出应为:

    List of devices attached
    ABC123456789    device
    

    (其中 ABC123456789 是你的设备唯一 ID)

  • ❌ 如果显示 unauthorized:手机弹出“允许 USB 调试吗?”提示,勾选“始终允许”并点确定

  • ❌ 如果显示空列表或 offline:检查 USB 线是否支持数据传输(很多充电线不传数据)、更换 USB 接口、重启手机 ADB 开关

至此,你的手机已正式成为 Open-AutoGLM 的“执行终端”。接下来只需部署控制端代码,就能让 AI 下达第一条指令。


4. 部署 Open-AutoGLM 控制端:三行命令,启动你的手机 AI 助理

控制端代码就是 Open-AutoGLM 仓库里的 Python 脚本,它负责:
① 抓取手机屏幕 → ② 发送给云端大模型 → ③ 接收模型返回的操作指令 → ④ 用 ADB 执行

整个过程无需你写一行逻辑,只需正确配置连接参数。

4.1 克隆代码 & 安装依赖(5 分钟搞定)

# 1. 克隆官方仓库(推荐使用 HTTPS,无需配置 SSH)
git clone https://github.com/zai-org/Open-AutoGLM
cd Open-AutoGLM

# 2. 创建并激活虚拟环境(隔离依赖,避免冲突)
python3 -m venv .venv
source .venv/bin/activate  # macOS/Linux
# 或 Windows 用户运行:.venv\Scripts\activate.bat

# 3. 安装全部依赖(含 ADB 封装库、HTTP 客户端等)
pip install -r requirements.txt
pip install -e .

4.2 运行第一条指令:让 AI 打开一个 App

假设你已按前文完成:
手机开启开发者模式 + USB 调试
ADB Keyboard 已安装并启用
adb devices 能看到设备 ID(如 ABC123456789
云端大模型服务已部署(地址如 http://10.1.21.133:8000/v1,模型名 autoglm-phone-9b

现在,执行这条命令:

python main.py \
  --device-id ABC123456789 \
  --base-url http://10.1.21.133:8000/v1 \
  --model "autoglm-phone-9b" \
  "打开知乎,搜索‘AI 手机助手’"
  • --device-id:填 adb devices 输出的 ID(USB 连接)或 IP:端口(WiFi 连接)
  • --base-url:替换为你实际部署的大模型 API 地址(格式必须带 /v1
  • 最后字符串:就是你对 AI 下达的自然语言指令,越具体越好(如“在淘宝搜 iPhone 15 保护壳,按销量排序,点第一个商品”)

实际效果:你会看到手机屏幕自动亮起 → 启动知乎 → 顶部搜索框被点击 → 键盘弹出 → 文字“AI 手机助手”逐字输入 → 搜索按钮被点击 → 结果页加载。整个过程约 10–30 秒,取决于网络和模型响应速度。


5. 进阶技巧:WiFi 远程控制、敏感操作接管、故障排查

USB 线缆虽稳定,但限制移动性。Open-AutoGLM 支持 WiFi 远程调试,让手机摆脱线缆束缚,真正实现“放在桌上,AI 自动干活”。

5.1 用 WiFi 替代 USB:断开线缆,照样操控

前提:手机与电脑在同一局域网(如都连着同一个路由器)。

  • 第一步(仅需一次):用 USB 线连接手机,运行:

    adb tcpip 5555
    

    (手机会重启 ADB 服务,监听 5555 端口)

  • 第二步:拔掉 USB 线,查看手机 WiFi IP(设置 → WLAN → 点击当前网络 → IP 地址,如 192.168.1.105

  • 第三步:电脑命令行连接:

    adb connect 192.168.1.105:5555
    

    成功后 adb devices 会显示 192.168.1.105:5555 device

  • 后续使用:所有 main.py 命令中的 --device-id 直接填 192.168.1.105:5555 即可,无需插线。

5.2 敏感操作人工接管:当 AI 遇到验证码、支付密码

Open-AutoGLM 内置安全机制,遇到以下场景会暂停并等待你手动操作:

  • 需要输入短信验证码的登录页
  • 支付确认弹窗(含指纹/面容 ID 提示)
  • 系统级权限申请(如“允许访问位置信息”)

此时,AI 会在控制台输出类似:

[PAUSE] Detected login screen with SMS verification. Please enter code manually.
Press Enter to continue after manual input...

你只需在手机上完成输入,回车确认,AI 即恢复执行。这不是缺陷,而是设计的安全护栏——它确保高风险操作永远由人决策。

5.3 常见问题速查表(比翻文档快 10 倍)

现象 最可能原因 一句话解决
adb devices 显示 unauthorized 手机未授权调试 查看手机弹窗,勾选“始终允许”并确认
adb devices 为空列表 USB 线仅充电 / 驱动未装 换线、换 USB 口;Windows 用户安装 Universal ADB Driver
运行 main.py 报错 ADBKeyboard not installed 检测脚本误判 编辑 main.py 第 127 行附近,将 check_adb_keyboard() 返回值强制设为 True(临时绕过)
AI 打开 App 后卡住不动 模型未收到截图 / 网络延迟 检查 --base-url 是否可访问(浏览器打开测试);WiFi 连接时优先改用 USB
输入文字失败(键盘不弹出) ADB Keyboard 未启用为默认 设置 → 语言与输入法 → 切换默认输入法为 ADB Keyboard

6. 总结:你刚刚解锁的,是一个可进化的手机操作系统

回看整个流程:
从“设置里点 7 下版本号”的简单动作,到 adb devices 显示设备 ID 的确认时刻,再到 python main.py 成功驱动手机完成复杂任务——你完成的不只是一个技术配置,而是亲手为手机植入了一套可理解、可规划、可执行的 AI 神经系统

Open-AutoGLM 的价值,不在于它多快或多准,而在于它把过去需要写脚本、调接口、做 OCR 的繁琐自动化,压缩成一句“打开小红书搜露营装备”。它不替代人类,而是把重复性交互劳动,变成一次自然语言对话。

下一步,你可以:
尝试更复杂的指令:“在闲鱼上找二手 AirPods Pro,预算 800 元以内,筛选‘最近发布’,联系卖家问是否带充电盒”
把常用指令写成 Shell 脚本,一键执行
结合定时任务(如 cron),让 AI 每天早 8 点自动刷本地新闻 App

技术终将隐形,而体验,才刚刚开始。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐