在前面的博文中简单解析了一款智能AI应用的操作使用。https://csdn9.blog.csdn.net/article/details/156427864?spm=1001.2014.3001.5502

              这款应用如需达到最好的使用效果必须使用adb进行配置。今天这款开源应用完全摆脱 ADB 数据线与 PC 端 Python 环境,安装此款 App 即可使用。

目前这个原作者还在持续更新中,更强大的功能和Ai能力会持续提升。

应用特点:

1-----原生 Android 实现:基于 Kotlin 开发,截图、分析、决策、执行全部在手机本地完成。

2------多 Agent 协作机制:借鉴 Claude Code 的设计思想,采用 Tools / Skills 双层架构,实现任务规划与执行解耦。

3-------高度可定制:支持通义千问、GPT-4V、Claude 以及本地 Ollama 等多种模型后端。

工具的优势

原生 Android 实现,不是 Python 脚本的封装。目前市面上几乎所有手机自动化开源项目(包括阿里的 MobileAgent)都是 Python 实现,需要:

在电脑上运行 Python 脚本手机通过 USB/WiFi ADB 连接电脑截图通过 ADB 传输到电脑,处理后再把操作指令传回手机

用 Kotlin 重写了整个 MobileAgent 框架,原生运行在 Android 设备上:

截图、分析、执行全部在手机本地完成

无需电脑中转,延迟更低

利用 Shizuku 获得系统级权限,而非繁琐的 ADB 命令

截图演示

无需root的Shizuku安装

模拟用户点击、滑动屏幕。读取其他 App 的界面内容

执行 input tapscreencap 等系统命令。传统方案需要连接电脑执行 ADB 命令。而 Shizuku 是一个优雅的解决方案:这让肉包可以直接在手机上执行截图、点击、输入等操作,真正实现「一个 App 搞定一切」。

             这款应用的优势不仅体现在便捷的ADB配置环节,更在于构建了一套低延迟、高权限的本地闭环系统。通过Tools/Skills双层架构实现任务逻辑解耦,结合多模型后端的灵活切换,该应用在开源生态中填补了"原生Android+视觉智能(VLM)"的技术空白。这不仅是对闭源硬件方案的优质替代,更开创了移动端Agent运作的新范式:通过深度解耦系统级权限与大模型推理能力,让手机自动化真正回归移动场景的本质需求。

开源https://github.com/Turbo1123/roubao

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐