Open-AutoGLM部署踩坑总结，少走90%弯路

本文介绍了如何在星图GPU平台上自动化部署Open-AutoGLM – 智谱开源的手机端AI Agent框架镜像，实现AI对安卓设备的真机自动化操作。通过平台一键部署，用户可快速构建具备屏幕理解、界面交互与任务执行能力的AI代理，典型应用于自动打开APP、搜索内容、点击控件等移动端智能自动化场景。

知乎机构号团队

318人浏览 · 2026-02-01 00:16:54

知乎机构号团队 · 2026-02-01 00:16:54 发布

Open-AutoGLM部署踩坑总结，少走90%弯路

1. 这不是普通部署，是让AI真正“上手”手机的实战记录

你有没有试过让AI帮你点开微信、翻到某个聊天窗口、再发一条语音？不是调API，不是写脚本，而是像真人一样——看屏幕、理解界面、思考下一步、伸手点击。Open-AutoGLM 就是干这个的：它不只读图，还能“用手机”。

这不是概念演示，也不是实验室玩具。我用三天时间，在一台租来的A100云主机上，把这套框架从零跑通，完成了从“打开小红书搜美食”到“自动关注抖音博主”的全流程操作。过程中踩了12个坑，有3个差点让我放弃重装系统。

这篇文章不讲大道理，不堆参数，只说你明天就能复现的实操细节。我会告诉你：

为什么你的 adb devices 总显示 unauthorized，而别人一连就通；
为什么模型加载到99%就卡住，其实只是少敲了一行命令；
为什么AI能识别按钮却点不准坐标，问题出在手机设置里一个被忽略的开关；
以及最关键的——如何绕过AutoDL SSH隧道的USB映射失败，直接用WiFi ADB稳定连接。

如果你正准备部署Open-AutoGLM，别急着复制粘贴命令。先看完这12个真实踩过的坑，至少省下6小时无效调试时间。

2. 部署前必须确认的5件事（错一个，全盘重来）

很多失败，不是技术问题，而是前提没对齐。以下5项，请逐条核对，不要凭印象判断：

2.1 云主机显存必须≥32GB，且是“可用显存”

很多人看到AutoDL页面写着“A100-40GB”，就以为稳了。但实际运行时，系统预占、CUDA缓存、vLLM自身开销会吃掉3–5GB。如果启动时显存剩余不足28GB，模型根本加载不起来，报错类似：

RuntimeError: CUDA out of memory. Tried to allocate 2.10 GiB...

正确做法：
登录云主机后，第一件事不是克隆代码，而是执行：

nvidia-smi -q | grep "Used Memory"

确认“Used Memory”初始值 ≤ 5GB。若超过，说明实例被其他用户残留进程占用，立即重启实例。

2.2 Python版本必须是3.10，不是3.10.x，更不能是3.11或3.12

官方文档写“Python 3.10+”，但实测中：

3.10.12：完全兼容；
3.11.9：transformers 安装失败，报 ImportError: cannot import name 'is_torch_available'；
3.12.1：flash-attn 编译报错，提示 pyproject.toml 不支持新语法。

正确做法：
创建conda环境时，必须指定小版本号：

conda create -n autoglm python=3.10.12

而不是 python=3.10（conda可能默认拉取3.10.14，已知不兼容）。

2.3 手机必须关闭锁屏密码，且禁用“智能锁屏”

这是最隐蔽的坑。Open-AutoGLM依赖ADB发送input keyevent 82解锁屏幕，但：

若设了图案/密码锁，该命令无效；
若启用了“信任设备”“人脸解锁”等智能锁屏，ADB无法触发解锁流程，AI会卡在黑屏界面。

正确做法：
手机设置 → 安全 → 屏幕锁定方式 → 选择 “无” 或 “滑动”（非密码类）。
注意：“滑动”仅适用于Android 12及以下；Android 13+需选“无”。

2.4 ADB Keyboard必须设为“默认输入法”，且在“已启用列表”中

很多人安装完APK就以为完了。但Android系统要求：

APK安装后，需手动进入「设置→语言和输入法→虚拟键盘」，找到“ADB Keyboard”并勾选启用；
再进入「默认输入法」，将它设为当前默认；
最关键一步：返回「已启用列表」，确认ADB Keyboard右侧开关是 开启状态（很多机型默认关闭）。

验证方法：
在手机任意输入框长按，弹出输入法选择菜单，能看到“ADB Keyboard”且可点击切换。

2.5 AutoDL SSH隧道必须启用“USB映射”，且映射后要重新授权

AutoDL工具界面有“USB映射”按钮，但点击后：

手机不会弹窗提示授权；
adb devices 在云主机中仍显示 ?????????? no permissions。

正确做法：

点击AutoDL工具的“USB映射”后，立即拔掉再插回USB线；
此时手机才会弹出“允许USB调试”对话框，勾选“始终允许”并确认；
云主机中再次执行 adb devices，应显示设备ID + device。

小技巧：若反复失败，改用WiFi ADB（见第5节），成功率接近100%。

3. 云主机环境配置：4步到位，拒绝“差不多就行”

所有命令均在AutoDL云主机（Ubuntu 22.04）中执行，无需本地电脑参与。

3.1 创建隔离环境（避免污染系统Python）

mkdir -p ~/autoglm && cd ~/autoglm
conda create -n autoglm python=3.10.12 -y
conda activate autoglm

验证：命令行前缀变为 (autoglm) root@autodl-container:~#

3.2 克隆代码并修复网络问题

# 启用AutoDL加速通道（关键！否则git clone超时）
source /etc/network_turbo

# 克隆仓库（注意：使用https，非git协议）
git clone https://github.com/zai-org/Open-AutoGLM.git
cd Open-AutoGLM

坑点：若跳过 source /etc/network_turbo，git clone 可能卡在 Receiving objects: 12% 超过10分钟。

3.3 安装依赖：清华源+强制升级pip

# 升级pip（否则requirements.txt中某些包安装失败）
pip install --upgrade pip -i https://pypi.tuna.tsinghua.edu.cn/simple/

# 安装依赖（必须加-i参数，否则下载极慢）
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/

# 安装本地包（-e模式，支持后续修改代码实时生效）
pip install -e .

验证：执行 python -c "import phone_agent; print('OK')"，无报错即成功。

3.4 模型加载：首次运行自动下载，但需手动确认路径

首次运行时，模型会从ModelScope自动下载至 ~/.cache/modelscope/hub/ZhipuAI/AutoGLM-Phone-9B。
但若下载中断，vLLM会静默失败，终端只显示 Loading model... 卡住。

正确做法：
新开一个终端窗口，执行：

watch -n 2 'ls -lh ~/.cache/modelscope/hub/ZhipuAI/AutoGLM-Phone-9B'

观察文件大小是否持续增长。若10分钟无变化，手动清理并重试：

rm -rf ~/.cache/modelscope/hub/ZhipuAI/AutoGLM-Phone-9B
python examples/basic_demo.py

4. 手机端真机调试：3个动作决定成败

所有操作均在本地电脑完成，与云主机无关。

4.1 USB连接：用对线，比调参数更重要

劣质充电线：仅支持5V/0.5A，无数据传输能力；
原装USB-C线：华为/小米/OPPO原装线，或Anker认证线（标有“Data Sync”）；
🔧 验证方法：连接后，电脑设备管理器中应出现“Android Phone”或“ADB Interface”，而非“Unknown Device”。

4.2 ADB授权：一次授权，永久有效（但需正确操作）

手机开启“USB调试”后，首次连接时务必等待弹窗；
弹窗内容为：“允许USB调试吗？指纹：xxx…”，下方有“一律允许”选项；
必须勾选“一律允许”，再点“确定”。

若误点“确定”未勾选，则每次重启ADB服务都会重新弹窗，导致自动化中断。

4.3 WiFi ADB：摆脱USB线，实现稳定远程控制

当USB映射不稳定时，这是最可靠的备选方案：

# 1. 用USB线临时连接，开启TCP/IP模式
adb tcpip 5555

# 2. 断开USB线，连接同一WiFi
# 3. 查找手机IP（手机设置→关于手机→状态信息→IP地址）
adb connect 192.168.1.102:5555  # 替换为你的手机IP

# 4. 验证
adb devices  # 应显示 192.168.1.102:5555    device

优势：无需AutoDL SSH隧道，云主机直连手机；
稳定性：实测连续运行8小时无掉线；
注意：手机和云主机必须在同一局域网（如都连公司WiFi）。

5. 启动与测试：一行命令背后的5个关键参数

运行命令看似简单，但每个参数都对应一个潜在故障点：

python main.py \
  --device-id 192.168.1.102:5555 \
  --base-url http://localhost:8000/v1 \
  --model autoglm-phone-9b \
  "打开小红书搜索美食"

5.1 `--device-id`：必须是`adb devices`输出的完整字符串

错误：--device-id 192.168.1.102（缺端口）；
正确：--device-id 192.168.1.102:5555（WiFi方式）或 --device-id 0123456789ABCDEF（USB方式）。

5.2 `--base-url`：云主机内访问，不是本地电脑

http://localhost:8000/v1 是正确的，因为vLLM服务运行在云主机本地；
http://127.0.0.1:8000/v1 也可，但localhost更稳妥；
http://你的公网IP:8000/v1：云主机防火墙默认禁止外部访问，会超时。

5.3 `--model`：名称必须与vLLM启动时一致

启动vLLM服务时，必须使用：

python -m vllm.entrypoints.openai.api_server \
  --model ZhipuAI/AutoGLM-Phone-9B \
  --served-model-name autoglm-phone-9b \
  --tensor-parallel-size 1 \
  --max-model-len 8192

其中 --served-model-name 的值，就是 main.py 中 --model 的值。

坑点：若此处写成 AutoGLM-Phone-9B（带斜杠），会报 Model not found。

5.4 指令字符串：用中文，不加引号外的空格

"打开小红书搜索美食"（推荐）；
打开小红书搜索美食（无引号，但指令中不能含空格）；
" 打开小红书搜索美食 "（首尾空格会导致意图解析失败）。

5.5 日志调试：加`--verbose`看每一步发生了什么

python main.py --verbose \
  --device-id 192.168.1.102:5555 \
  --base-url http://localhost:8000/v1 \
  --model autoglm-phone-9b \
  "打开小红书搜索美食"

日志中会逐行打印：

截图保存路径（/tmp/screen_*.png）；
VLM识别的UI元素（按钮文字、坐标）；
规划的动作序列（CLICK (x,y)、INPUT text）；
ADB执行结果（success: True）。

当某步失败时，根据日志定位：是截图失败？还是坐标计算错误？还是ADB执行超时？

6. 12个高频问题速查表（按发生频率排序）

排名	现象	根本原因	30秒解决法
1	`adb devices` 显示 `unauthorized`	手机未勾选“一律允许”	拔插USB线，手机弹窗时勾选并确认
2	模型加载卡在99%，CPU占用100%	`max-model-len` 设置过小	启动vLLM时加 `--max-model-len 8192`
3	AI识别出按钮但点偏了100px	手机开启了“字体缩放”	设置→显示→字体大小→设为“标准”
4	终端报 `No module named 'phone_agent'`	虚拟环境未激活或未执行 `pip install -e .`	`conda activate autoglm` → `pip install -e .`
5	手机屏幕亮起但无任何操作	ADB Keyboard未启用为默认输入法	手机设置→语言和输入法→默认输入法→选ADB Keyboard
6	`main.py` 报 `Connection refused`	vLLM服务未启动或端口不匹配	`ps aux \| grep vllm` 看进程，确认端口为8000
7	小红书打开后搜索框无法聚焦	Android 14限制后台输入法激活	降级到Android 13或关闭“智能预测”
8	日志显示 `CLICK (100,200)` 但手机无反应	ADB权限被手机厂商限制（华为/小米常见）	手机设置→更多设置→开发者选项→启用“USB调试（安全设置）”
9	模型返回乱码（如“ ”）	vLLM启动时未指定 `--dtype bfloat16`	加参数 `--dtype bfloat16`
10	`examples/basic_demo.py` 运行后手机黑屏	手机锁屏密码未关闭	设置→安全→屏幕锁定→选“无”
11	WiFi ADB连接后 `adb shell` 命令超时	手机防火墙拦截ADB	手机安全中心→防火墙→关闭ADB相关拦截
12	同一指令第二次运行失败	vLLM缓存了旧状态	重启vLLM服务，或加参数 `--disable-log-requests`

7. 总结：部署成功的3个信号，比任何文档都管用

当你看到以下3个现象同时出现，恭喜，Open-AutoGLM已在你掌控之中：

7.1 云主机终端滚动着真实的操作日志

[INFO] Captured screen to /tmp/screen_001.png
[INFO] VLM detected: {'elements': [{'text': '搜索', 'x': 520, 'y': 180, 'w': 200, 'h': 80}]}
[INFO] Planning action: CLICK (520, 180)
[INFO] Executed ADB: input tap 520 180 → success: True