1

AutoGLM-智谱开源的框架只需一句话就可以操作手机

我是贝东 发布于 阅读:62

智谱科技发布了3个划时代意义的产品,分别是针对手机的 AotoGML,针对电脑的 GML PC 和 web 的 GML web。

AutoGLM-智谱开源的框架只需一句话就可以操作手机工具推荐文章-作者:我是贝东示意图1

AutoGLM 构建,能通过自然语言指令实现手机操作的自动化。0pen-AutoGLM通过 Phone Use 能力框架,将自然语言指令转化为实际操作,如点击、滑动、输入等,可在外卖、社交、客服等场景中自动完成任务。框架借助云手机技术保障隐私安全。Open-AutoGLM 开源目的是推动行业共同进步,保护用户隐私,加速 Agent 技术爆发。目前支持 50 多款主流中文应用,提供完整工具链和详细文档,助力开发者快速上手和二次开发。

AutoGLM功能

生活服务自动化:操作各类生活、娱乐、购物类手机App,完成多步骤任务。

内容创作与发布:在云电脑上搜索信息、生成内容(PPT、视频),并尝试发布到社交平台。

跨应用办公流程:串联多个应用或操作,完成一个完整的办公或研究流程。

系统与权限管理:在云端虚拟设备中运行,处理通知,并在敏感操作时请求用户接管。

AutoGLM如何使用

下载 Open-AutoGLM:

访问 Open-AutoGLM GitHub 仓库 https://github.com/zai-org/Open-AutoGLM

点击页面右上角的“Code”按钮,选择“Download ZIP”,下载项目代码。

解压下载的文件到本地一个方便的目录(如c:\0pen-AutoGLM或~/0pen-AutoGLM )。国安装依赖:D”打开命令行工具(Windows 的命令提示符或 PowerShell,Mac/Linux 的终端)。

切换到解压后的项目目录:

cd path/to/open-AutoGLM

输入以下命令安装依赖:

pip install -r requirements.txt

启动模型服务:

"输入以下命令启动模型服务(这是必须的步,但不需要理解代码):

python3 -m vllm,entrypoints,openai,api server --model zai-org/AutoGLM-Phone-98 --port8000

如果看到服务启动成功的提示,就可以进行下一步。

此次开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM,在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手。目前,AutoGLM已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景。

AutoGLM的开源将大幅降低AI手机的技术门槛,推动AI手机生态从封闭走向开放共创。

同时,项目支持本地与云端部署,确保数据与隐私控制权始终掌握在使用者手中。

评论列表

avatar
我是贝东
1 个月前
哈哈

需要登录才能发表回复

请登录或注册以继续。