OMG-Agent:开源安卓自动化助手,通过自然语言操控手机任务

显示 1 OMG-Agent简介 2 项目亮点 3 使用流程概览 4 支持模型介绍 5 适合谁使用? 6 OMG-Agent获取项目 OMG-Agent简介OMG-Agent 是一款基于自然语言指令的开源移动端自动化助手,专为 Android 手机操作场景设计,支持多种 GUI 模型和跨平台部署,适...
OMG-Agent简介
OMG-Agent 是一款基于自然语言指令的开源移动端自动化助手,专为 Android 手机操作场景设计,支持多种 GUI 模型和跨平台部署,适合开发者、AI爱好者及效率控使用。
项目亮点
- 开源透明:完全开源,托管于 GitHub,支持二次开发与社区共建
- 自然语言驱动:输入如“打开微信发消息给张三”的指令,即可完成手机自动化任务
- 模型支持丰富:内置支持 AutoGLM 和 GELab-Zero 等知名手机 GUI 模型
- ADB 实时操控:通过 ADB 接口与 Android 设备交互,支持截图、操作执行等功能
- 双语界面 + 主题切换:中英文界面自由切换,支持暗色/亮色模式
- 兼容性强:支持真实 Android 手机和模拟器,兼容 OpenAI 接口调用
使用流程概览
- 安装 ADB 环境
- Windows:
scoop install adb - macOS:
brew install android-platform-tools - Linux:
apt install adb
- Windows:
- 克隆并运行
git clone https://github.com/safphere/OMG-Agent.gitcd OMG-Agentpip install -r requirements.txtpython run.py - 手机配置
- 开启开发者选项 + USB调试
- 安装 ADBKeyboard 输入法
- 使用 USB 连接手机并授权
- 开始使用
- 点击「刷新」识别设备
- 点击「开始投屏」预览界面
- 输入自然语言任务并点击「执行」
支持模型介绍
| 模型名称 | 来源 | 特点 |
|---|---|---|
| AutoGLM-Phone-9B | 智谱AI | 针对手机 GUI 操作优化的大模型 |
| GELab-Zero-4B-preview | 阶跃星辰 | 适用于通用手机 Agent 任务的轻量模型 |
这些模型均为专门训练的手机图形界面大模型,可高效处理复杂操作任务。
适合谁使用?
- 想用自然语言远程操控手机的极客玩家
- 研究自动化 UI 测试或 Agent 技术的开发者
- 从事 AI Agent 产品研发、验证与测试的团队
- 有多设备协同需求的自动化工作者
OMG-Agent获取项目
安装地址:网盘
GitHub 开源地址: https://github.com/safphere/OMG-Agent/