AutoGLM-Phone支持模拟器吗？开发测试环境部署案例

本文介绍了如何在星图GPU平台上自动化部署Open-AutoGLM – 智谱开源的手机端AI Agent框架镜像，实现基于自然语言指令的移动端自动化操作。通过模拟器环境，可快速验证如‘打开微信发送消息’等典型任务，显著提升AI Agent开发与测试效率。

欧学东

143人浏览 · 2026-01-24 01:53:58

欧学东 · 2026-01-24 01:53:58 发布

AutoGLM-Phone支持模拟器吗？开发测试环境部署案例

AutoGLM-Phone 是当前少有的真正面向移动端落地的 AI Agent 框架，它不依赖预设脚本，也不靠固定 UI 元素定位，而是用视觉语言模型“看懂”屏幕、“想清楚”步骤、“动得准”操作。很多开发者第一次接触时最关心的问题就是：我手头没有真机，能用模拟器跑起来吗？开发调试阶段到底怎么搭环境才不踩坑？ 这篇文章不讲原理、不堆参数，就带你从零开始，在本地电脑上用模拟器快速跑通整个流程——包括环境准备、ADB 配置、服务连接、指令执行，以及最关键的模拟器兼容性验证。

1. AutoGLM-Phone 是什么？一句话说清它的能力边界

AutoGLM-Phone 不是另一个“手机版大模型”，而是一个以视觉理解为起点、以自动化执行为终点的端到端手机智能体框架。它把三个关键能力拧成一股绳：

看得懂：不是简单 OCR 文字，而是用多模态模型理解整个屏幕画面——按钮位置、图标含义、列表结构、输入框状态，甚至弹窗层级关系；
想得对：接收到“打开小红书搜美食”这样的自然语言指令后，它会自动拆解成“启动 App → 等待首页加载 → 点击搜索框 → 输入关键词 → 点击搜索按钮”这一连串可执行动作；
动得稳：通过 ADB 发送精准指令（tap、swipe、input text、keyevent），所有操作都基于实时屏幕反馈动态调整，不是硬编码坐标。

它和传统自动化工具（如 Appium、UI Automator）的本质区别在于：不需要你写一行定位代码，也不需要提前知道界面结构。你告诉它“要做什么”，它自己决定“怎么做”。

1.1 模拟器到底支不支持？答案很明确：支持，但有前提

直接说结论：AutoGLM-Phone 完全支持安卓模拟器，且在开发测试阶段，模拟器反而是更高效的选择。原因有三：

ADB 兼容性好：主流模拟器（Android Studio 自带的 Emulator、BlueStacks、MuMu、雷电）均完整支持 ADB 协议，adb devices 能识别，adb shell input tap 能执行，这是底层基础；
屏幕采集无门槛：模拟器可直接通过 adb exec-out screencap -p 截图，无需额外权限或 root，截图延迟低、画质稳定；
调试友好度高：可随时暂停、重启、重置模拟器，配合日志输出，比真机反复插拔、授权弹窗更省时间。

但要注意两个常见限制：

某些国产模拟器（如早期版本的夜神）可能禁用 adb shell input 命令，需在设置中开启“允许通过 ADB 控制”选项；
Android 12+ 模拟器默认启用“隐私沙盒”，可能影响部分应用的后台行为，建议开发测试时使用 Android 11（R）系统镜像。

2. 本地开发环境搭建：Windows/macOS + 模拟器实操指南

别被“AI Agent”四个字吓住——整个控制端（Open-AutoGLM）本质是个轻量 Python 工程，核心依赖只有 ADB 和 HTTP 客户端。下面以 Windows + Android Studio 模拟器 为例，全程截图级还原，macOS 用户只需注意路径和命令微调即可。

2.1 环境准备：四步到位，5 分钟搞定

组件	版本要求	验证方式	备注
操作系统	Windows 10+/macOS 12+	`winver` 或 `sw_vers`	推荐 64 位系统
Python	3.10 ~ 3.12	`python --version`	避免 3.13（部分依赖未适配）
模拟器	Android 11（R）x86_64	启动后 Settings → About → Android version	系统镜像选 “Google APIs Intel x86_64 Atom System Image”
ADB	Platform-tools v34+	`adb version`	从 developer.android.com 下载

为什么推荐 Android 11 模拟器？
Android 10 开始强制启用 Scoped Storage，部分 App 截图权限受限；Android 12+ 引入 Privacy Sandbox，后台服务管控更严。Android 11 在兼容性与功能完整性之间取得最佳平衡，实测截图成功率 >99.5%，ADB 响应延迟 <80ms。

2.2 ADB 配置：一次设置，永久生效

Windows 用户（图形化操作，零命令行压力）

下载 platform-tools_windows.zip，解压到 C:\adb\（路径不含中文和空格）；
Win + R → 输入 sysdm.cpl → “高级” → “环境变量”；
在“系统变量”中找到 Path → “编辑” → “新建” → 粘贴 C:\adb；
打开新终端窗口，输入 adb version，看到类似 Android Debug Bridge version 1.0.41 即成功。

macOS 用户（终端一行命令）

# 下载后解压到 ~/Downloads/platform-tools
export PATH="$PATH:~/Downloads/platform-tools"
# 写入 shell 配置（zsh 用户）
echo 'export PATH="$PATH:~/Downloads/platform-tools"' >> ~/.zshrc
source ~/.zshrc
adb version  # 验证

2.3 模拟器启动与 ADB 连接：三步确认连通性

启动模拟器：打开 Android Studio → AVD Manager → 选择已创建的 Android 11 模拟器 → “Launch”；
等待完全启动：看到锁屏界面或主屏幕（非黑屏/白屏/卡在 Google Logo）；
终端执行验证命令：

adb devices
# 正常输出示例：
# List of devices attached
# emulator-5554	device

出现 emulator-5554 device 表示连接成功。
❌ 若显示 offline：重启模拟器；若为空：检查模拟器是否启用“Use Host GPU”（AVD 设置 → Emulated Performance）。

3. 控制端部署：从克隆到运行，不跳过任何细节

Open-AutoGLM 的控制端代码非常干净，没有隐藏配置、没有强制云服务绑定，本地即可驱动模拟器完成全流程。

3.1 克隆与安装：避开 pip 依赖冲突陷阱

# 推荐新建独立虚拟环境（防污染）
python -m venv autoglm-env
autoglm-env\Scripts\activate  # Windows
# autoglm-env/bin/activate     # macOS

git clone https://github.com/zai-org/Open-AutoGLM
cd Open-AutoGLM

# 关键：先升级 pip，再装依赖（避免旧版 pip 解析失败）
pip install --upgrade pip

# 安装时加 --no-deps 跳过 vLLM（我们用云端模型，本地不需推理）
pip install -r requirements.txt --no-deps
pip install -e .

实测发现：requirements.txt 中的 vllm==0.4.2 与 Windows 上 CUDA 12.1 兼容性不佳，若报错 DLL load failed，请直接删掉该行再重装。AutoGLM-Phone 控制端本身不执行推理，只做指令编排与 ADB 调用。

3.2 启动 AI 代理：一条命令，让模拟器“活”起来

假设你已部署好云端模型服务（如通过 vLLM 启动 autoglm-phone-9b，监听 http://192.168.1.50:8800/v1），现在只需在本地执行：

python main.py \
  --device-id emulator-5554 \
  --base-url http://192.168.1.50:8800/v1 \
  --model "autoglm-phone-9b" \
  "打开微信，进入文件传输助手，发送文字'你好，这是 AutoGLM-Phone 测试'"

你会看到终端实时打印：

[INFO] 截图已保存至 ./screenshots/xxx.png
[INFO] VLM 分析结果：当前在微信主界面，底部导航栏可见“微信”“通讯录”“发现”“我”
[INFO] 规划动作：点击“通讯录” → 滑动查找“文件传输助手” → 点击 → 点击输入框 → 输入文字 → 点击发送

几秒后，模拟器内微信自动完成全部操作——这就是 AutoGLM-Phone 的真实工作流，不是 Demo，是可复现的工程能力。

3.3 Python API 方式调用：适合集成进自己的测试平台

如果你不想每次敲命令，而是想把它嵌入自动化测试脚本，phone_agent.adb 模块提供了清晰接口：

from phone_agent.adb import ADBConnection
from phone_agent.agent import PhoneAgent

# 1. 连接模拟器
conn = ADBConnection()
conn.connect("emulator-5554")  # 设备 ID

# 2. 初始化代理（指定云端模型地址）
agent = PhoneAgent(
    device_id="emulator-5554",
    base_url="http://192.168.1.50:8800/v1",
    model_name="autoglm-phone-9b"
)

# 3. 执行指令（返回结构化结果）
result = agent.run("打开设置，搜索'电池'，进入电池优化设置")
print(f"执行状态：{result.status}")
print(f"耗时：{result.duration:.2f}s")
print(f"关键步骤：{[step.action for step in result.steps[:3]]}")

这种写法让你能轻松构建回归测试集、批量任务调度器，甚至做成 Web 界面供产品同学试用。

4. 模拟器专属问题排查：这 3 类错误，90% 的人会遇到

即使配置完全正确，模拟器环境下仍有一些“只在此山中”的典型问题。以下是实测高频报错及一招解决法：

4.1 错误：`screencap: Unable to open /dev/graphics/fb0`

现象：截图失败，日志报设备 fb0 权限拒绝；
原因：模拟器未启用硬件加速或显存不足；
解决：

Android Studio → AVD Manager → Edit → Show Advanced Settings → Graphics → 选 Hardware - GLES 2.0；
Memory → RAM 调至 3072 MB 以上；
再次启动模拟器，重试 adb shell screencap -p。

4.2 错误：`input keyevent 66 not working`（回车键无效）

现象：输入文字后无法触发搜索/发送；
原因：模拟器输入法未正确响应 ADB 输入事件；
解决：

模拟器内 Settings → System → Languages & input → Virtual keyboard → Gboard → Preferences → 关闭 “Use hardware keyboard”；
或改用 adb shell input text "hello%sworld"（%s 代表空格，%d 代表删除）。