×

OMG-Agent:开源安卓自动化助手,通过自然语言操控手机任务

OMG-Agent:开源安卓自动化助手,通过自然语言操控手机任务
显示 1 OMG-Agent简介 2 项目亮点 3 使用流程概览 4 支持模型介绍 5 适合谁使用? 6 OMG-Agent获取项目 OMG-Agent简介OMG-Agent 是一款基于自然语言指令的开源移动端自动化助手,专为 Android 手机操作场景设计,支持多种 GUI 模型和跨平台部署,适...
  • 1天前
  • OMG-Agent简介

    OMG-Agent 是一款基于自然语言指令的开源移动端自动化助手,专为 Android 手机操作场景设计,支持多种 GUI 模型和跨平台部署,适合开发者、AI爱好者及效率控使用。

    项目亮点

    • 开源透明:完全开源,托管于 GitHub,支持二次开发与社区共建
    • 自然语言驱动:输入如“打开微信发消息给张三”的指令,即可完成手机自动化任务
    • 模型支持丰富:内置支持 AutoGLM 和 GELab-Zero 等知名手机 GUI 模型
    • ADB 实时操控:通过 ADB 接口与 Android 设备交互,支持截图、操作执行等功能
    • 双语界面 + 主题切换:中英文界面自由切换,支持暗色/亮色模式
    • 兼容性强:支持真实 Android 手机和模拟器,兼容 OpenAI 接口调用

    使用流程概览

    1. 安装 ADB 环境
      • Windows: scoop install adb
      • macOS: brew install android-platform-tools
      • Linux: apt install adb
    2. 克隆并运行
      git clone https://github.com/safphere/OMG-Agent.gitcd OMG-Agentpip install -r requirements.txtpython run.py
    3. 手机配置
      • 开启开发者选项 + USB调试
      • 安装 ADBKeyboard 输入法
      • 使用 USB 连接手机并授权
    4. 开始使用
      • 点击「刷新」识别设备
      • 点击「开始投屏」预览界面
      • 输入自然语言任务并点击「执行」

    支持模型介绍

    模型名称来源特点
    AutoGLM-Phone-9B智谱AI针对手机 GUI 操作优化的大模型
    GELab-Zero-4B-preview阶跃星辰适用于通用手机 Agent 任务的轻量模型

    这些模型均为专门训练的手机图形界面大模型,可高效处理复杂操作任务。

    适合谁使用?

    • 想用自然语言远程操控手机的极客玩家
    • 研究自动化 UI 测试或 Agent 技术的开发者
    • 从事 AI Agent 产品研发、验证与测试的团队
    • 有多设备协同需求的自动化工作者

    OMG-Agent获取项目

    安装地址:网盘

    GitHub 开源地址: https://github.com/safphere/OMG-Agent/

    TOP