AutoGLM-智谱开源的框架只需一句话就可以操作手机
智谱科技发布了3个划时代意义的产品,分别是针对手机的 AotoGML,针对电脑的 GML PC 和 web 的 GML web。

AutoGLM 构建,能通过自然语言指令实现手机操作的自动化。0pen-AutoGLM通过 Phone Use 能力框架,将自然语言指令转化为实际操作,如点击、滑动、输入等,可在外卖、社交、客服等场景中自动完成任务。框架借助云手机技术保障隐私安全。Open-AutoGLM 开源目的是推动行业共同进步,保护用户隐私,加速 Agent 技术爆发。目前支持 50 多款主流中文应用,提供完整工具链和详细文档,助力开发者快速上手和二次开发。
AutoGLM功能
生活服务自动化:操作各类生活、娱乐、购物类手机App,完成多步骤任务。
内容创作与发布:在云电脑上搜索信息、生成内容(PPT、视频),并尝试发布到社交平台。
跨应用办公流程:串联多个应用或操作,完成一个完整的办公或研究流程。
系统与权限管理:在云端虚拟设备中运行,处理通知,并在敏感操作时请求用户接管。
AutoGLM如何使用
下载 Open-AutoGLM:
访问 Open-AutoGLM GitHub 仓库 https://github.com/zai-org/Open-AutoGLM
点击页面右上角的“Code”按钮,选择“Download ZIP”,下载项目代码。
解压下载的文件到本地一个方便的目录(如c:\0pen-AutoGLM或~/0pen-AutoGLM )。国安装依赖:D”打开命令行工具(Windows 的命令提示符或 PowerShell,Mac/Linux 的终端)。
切换到解压后的项目目录:
cd path/to/open-AutoGLM
输入以下命令安装依赖:
pip install -r requirements.txt
启动模型服务:
"输入以下命令启动模型服务(这是必须的步,但不需要理解代码):
python3 -m vllm,entrypoints,openai,api server --model zai-org/AutoGLM-Phone-98 --port8000
如果看到服务启动成功的提示,就可以进行下一步。
此次开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM,在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手。目前,AutoGLM已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景。
AutoGLM的开源将大幅降低AI手机的技术门槛,推动AI手机生态从封闭走向开放共创。
同时,项目支持本地与云端部署,确保数据与隐私控制权始终掌握在使用者手中。