admin 管理员组

文章数量: 1184232

Open-AutoGLM新闻聚合场景:热点资讯自动抓取实战

1. 为什么手机端AI Agent正在改变信息获取方式

你有没有过这样的经历:早上通勤路上想快速了解昨夜全球发生了什么,却在十几个新闻App之间反复切换、手动刷新、点开又关闭?或者想追踪某条突发社会事件的进展,却要不断在微博、小红书、抖音、微信公众号之间来回跳转,眼花缭乱还漏掉关键信息?

传统新闻聚合依赖RSS订阅或平台算法推荐,但它们无法理解“我想看今天上海暴雨对地铁运营的实际影响”这种带时空约束、多源交叉、需上下文判断的复杂需求。而Open-AutoGLM——智谱开源的手机端AI Agent框架,正试图从根本上解决这个问题。

它不是另一个新闻App,而是一个能真正“读懂屏幕、理解意图、自主操作”的数字助手。当你对它说“把过去24小时内所有关于‘杭州亚运会闭幕式’的短视频和图文报道,按热度排序整理成一份简报”,它不会只打开某个App搜索关键词,而是会依次进入抖音、小红书、B站、微信视频号,识别界面元素、滑动加载内容、截图关键信息、提取文字摘要,最后用自然语言生成结构化简报——整个过程无需你碰一下手机。

这背后不是简单的自动化脚本,而是视觉语言模型(VLM)+任务规划+ADB设备控制三位一体的能力融合。本文将带你从零开始,在真实安卓设备上部署Open-AutoGLM,并完成一个极具实用价值的落地场景: 热点资讯自动抓取与聚合 。不讲抽象架构,只聚焦你能立刻上手、当天就能用起来的完整链路。

2. Open-AutoGLM核心能力解析:它到底能做什么

2.1 不是“语音助手”,而是“屏幕级智能体”

很多人第一反应是:“这不就是Siri或小爱同学的升级版?”——恰恰相反。传统语音助手本质是“命令-响应”模式:你说“打开微信”,它调用系统API启动应用;你说“发消息给张三”,它调起微信聊天界面。它 不看屏幕,不理解界面,不感知当前状态

而Open-AutoGLM的Phone Agent框架,核心突破在于引入了 视觉闭环

  • 看得到 :通过ADB截屏,将手机当前界面实时传给视觉语言模型(如AutoGLM-Phone-9B),模型不仅能识别按钮、输入框、标题栏等UI元素,还能理解“这个红色感叹号图标代表未读消息”、“顶部搜索框下方的‘综合’‘视频’‘用户’是筛选标签”;
  • 想得清 :接收到“打开小红书搜美食”指令后,它先做意图分解——“打开小红书”是启动应用,“搜美食”是后续动作;再做界面推理——当前是否已在小红书首页?若在微信聊天界面,则需先返回桌面、找到小红书图标、点击进入,再定位搜索框;
  • 做得准 :通过ADB发送精确坐标点击、滑动、长按、输入文本等指令,每一步都基于对当前屏幕的理解动态决策,而非预设固定路径。

这意味着,它能处理 登录态变化、弹窗拦截、验证码跳转、页面加载延迟 等真实手机使用中的“毛刺问题”,这是纯API调用方案永远无法覆盖的长尾场景。

2.2 新闻聚合场景的独特适配性

为什么新闻聚合是Open-AutoGLM的“天选场景”?我们对比三个典型需求:

需求描述 传统方案痛点 Open-AutoGLM解决方案
“汇总昨晚世界杯决赛的球迷反应” 需手动打开微博热搜榜、抖音热榜、小红书话题页,逐个截图、复制评论,耗时20分钟以上 AI自动进入各平台热榜页,识别“#世界杯决赛”话题卡片,滑动加载前50条评论,提取情绪关键词(激动/失望/调侃),生成300字舆情摘要
“查今天北京地铁10号线早高峰延误原因” 在北京地铁App查不到实时延误,需翻微博搜“北京地铁10号线”,人工筛选官方通报、乘客实拍、交通委回应 AI自动搜索“北京地铁10号线”,优先识别北京地铁官微、@北京交通、本地大V账号的最新图文,过滤广告和无关转发,提取时间、地点、原因、预计恢复时间四要素
“对比iPhone16发布会三家科技媒体的首评重点” 打开中关村在线、爱范儿、少数派App,分别查找对应文章,手动比对“影像升级”“电池续航”“价格策略”三个维度的表述差异 AI并行打开三家媒体App,定位发布会专题页,精准提取每篇首评中关于三个维度的首段结论句,以表格形式横向对比,标出共识与分歧点

这些任务共同特点是: 跨App、强时效、需语义理解、容错要求高 ——恰好是Open-AutoGLM多模态感知+自主规划能力的发挥空间。

3. 本地环境搭建:从零连接你的真机

3.1 硬件与基础工具准备

这不是一个仅靠“pip install”就能跑起来的Python库,而是一套需要软硬协同的系统。请确保以下四项全部就绪:

  • 一台Windows或macOS电脑 :作为控制端,运行Python代码并管理ADB连接;
  • 一部Android 7.0+真机 (强烈建议不用模拟器):新闻聚合需真实App生态,模拟器无法安装小红书、抖音等主流应用;
  • USB数据线 :用于首次ADB配对与调试;
  • 稳定的WiFi网络 :用于后续无线控制,避免USB线缆束缚。

关键提醒 :不要跳过“真机”要求。模拟器缺少传感器、通知栏、后台服务等真实环境要素,会导致AI在识别“下拉通知栏查看新消息”或“从后台切回抖音”等操作时失败。

3.2 ADB环境配置:让电脑真正“看见”手机

ADB(Android Debug Bridge)是连接电脑与安卓设备的桥梁。配置不成功,后续所有操作都是空中楼阁。

Windows用户:
  1. 下载 压缩包,解压到 C:\adb
  2. Win + R → 输入 sysdm.cpl → “高级”选项卡 → “环境变量” → 在“系统变量”中找到 Path → “编辑” → “新建” → 添加 C:\adb
  3. 打开命令提示符,输入 adb version ,看到类似 Android Debug Bridge version 1.0.41 即成功。
macOS用户:
  1. 终端执行:
# 假设下载解压到 ~/Downloads/platform-tools
export PATH=$PATH:~/Downloads/platform-tools
# 永久生效:将上行添加到 ~/.zshrc 或 ~/.bash_profile
echo 'export PATH=$PATH:~/Downloads/platform-tools' >> ~/.zshrc
source ~/.zshrc
  1. 终端输入 adb version 验证。

3.3 手机端深度设置:解锁AI操控权限

仅开启USB调试远远不够,还需三项关键配置:

  1. 开启开发者模式
    设置 → 关于手机 → 连续点击“版本号”7次 → 输入锁屏密码 → 提示“您现在处于开发者模式”。

  2. 启用USB调试与网络调试
    设置 → 系统 → 开发者选项 → 勾选:

    • USB调试
    • USB调试(安全设置)
    • 网络ADB调试(为WiFi控制铺路)
  3. 安装ADB Keyboard(解决输入难题)

    • 下载 并安装;
    • 设置 → 语言与输入法 → 当前键盘 → 选择“ADB Keyboard”;
    • 重要 :在“已启用的键盘”中确保其被勾选,否则AI无法向搜索框输入文字。

避坑指南 :部分国产手机(华为、小米)有额外限制:

  • 华为需在“开发者选项”中关闭“仅充电模式下允许ADB调试”;
  • 小米需在“开发者选项”中开启“USB安装”和“USB调试(安全设置)”;
  • adb devices 显示 unauthorized ,请在手机弹出的授权对话框中点击“允许”。

4. 部署与运行:让AI开始为你抓取新闻

4.1 控制端代码部署

在本地电脑执行以下命令(确保已安装Git):

# 克隆官方仓库
git clone 
cd Open-AutoGLM
# 创建虚拟环境(推荐,避免依赖冲突)
python -m venv venv
source venv/bin/activate  # macOS/Linux
# venv\Scripts\activate  # Windows
# 安装依赖
pip install --upgrade pip
pip install -r requirements.txt
pip install -e .

此时,你的本地环境已具备调用Phone Agent的所有能力,但注意: 模型推理本身不在本地运行 。Open-AutoGLM采用“轻客户端+重云端”架构——控制逻辑在你电脑,而耗资源的视觉语言模型在云服务器上。你需要一个已部署好的AutoGLM-Phone服务端(可通过CSDN星图镜像广场一键获取)。

4.2 设备连接实战:USB与WiFi双模式

USB直连(推荐首次调试)
  1. 用USB线连接手机与电脑;
  2. 电脑终端执行:
adb devices

若输出类似 0123456789ABCDEF device ,说明连接成功; 3. 记下设备ID(如 0123456789ABCDEF ),后续命令中 --device-id 参数即为此值。

WiFi无线连接(日常使用首选)
  1. 确保手机与电脑在同一WiFi下;
  2. 首次需USB连接执行:
adb tcpip 5555  # 切换ADB到TCP模式
  1. 拔掉USB线,查看手机WiFi IP(设置 → WLAN → 点击当前网络 → IP地址),假设为 192.168.1.100
  2. 电脑执行:
adb connect 192.168.1.100:5555
adb devices  # 应显示 192.168.1.100:5555 device

稳定性提示 :WiFi连接偶尔会断开,若 adb devices 显示 offline ,只需重新执行 adb connect 192.168.1.100:5555 即可,无需插拔USB。

4.3 启动热点资讯抓取任务

假设你已在云服务器部署好AutoGLM-Phone服务,公网IP为 203.107.123.45 ,vLLM服务映射端口为 8800 ,则执行:

python main.py \
  --device-id 0123456789ABCDEF \
  --base-url  \
  --model "autoglm-phone-9b" \
  "打开微博热搜榜,找到‘上海暴雨’话题,截图前三条讨论,再打开小红书搜索‘上海暴雨应对’,保存前两条笔记封面和标题"
命令参数详解:
  • --device-id :你的设备唯一标识, adb devices 第一列内容;
  • --base-url :云服务地址,格式必须为 ,末尾 /v1 不可省略;
  • 最后字符串: 自然语言指令 ,越具体越好。避免模糊表述如“看看新闻”,应明确平台、动作、目标(如“打开抖音→搜索‘台风海葵’→进入第1个视频→截图评论区前3条”)。
实际运行效果:

你会看到终端实时打印AI的思考过程:

[INFO] 当前界面:手机桌面 → 正在定位小红书图标...
[INFO] 已点击小红书图标 → 等待应用启动...
[INFO] 当前界面:小红书首页 → 正在定位搜索框...
[INFO] 已点击搜索框 → 输入‘上海暴雨应对’...
[INFO] 当前界面:搜索结果页 → 正在滑动加载...
[INFO] 已截图第1条笔记封面 → 保存为 ./output/note1_cover.png
[INFO] 已提取第1条笔记标题:《上海暴雨自救指南,亲测有效!》
...
[SUCCESS] 任务完成,共获取4张截图、6条标题,结果存于 ./output/

所有截图与文本均自动保存至本地 ./output/ 目录,可直接用于制作简报。

5. 新闻聚合进阶技巧:让AI更懂你的需求

5.1 指令工程:用“三要素法”写出高质量指令

AI不是万能的,清晰的指令是高效执行的前提。我们总结出新闻抓取专用的“三要素指令公式”:

平台 + 动作 + 目标锚点

  • ❌ 差:“看看最近的科技新闻”(无平台、无动作、无目标)
  • 优:“在36氪App首页,下滑加载‘最新’栏目,截取前3篇标题含‘AI芯片’的文章封面和导语”

实践技巧

  • 指定平台 :优先用大众App(微博、抖音、小红书、微信公众号),避免冷门平台导致AI找不到入口;
  • 限定动作 :用“截图”“提取文字”“保存链接”“记录发布时间”等可量化动词;
  • 锚定目标 :用“前3条”“含XX关键词”“评论数>1000”“发布时间在2小时内”等条件缩小范围。

5.2 敏感操作安全机制:防止误触的双重保险

新闻抓取可能涉及账号登录、支付页面等敏感场景。Open-AutoGLM内置两层防护:

  1. 自动确认机制 :当AI检测到“登录”“支付”“删除”等高危UI元素(如红色“确认支付”按钮、弹窗“是否退出登录”),会暂停执行并输出提示:
    [ALERT] 检测到支付按钮,为保障安全,已暂停执行。请手动确认后输入 'continue' 继续,或 'abort' 中止。
    
  2. 人工接管接口 :在 main.py 中设置 --manual-intervention 参数,AI会在每个关键步骤(如点击搜索框前、截图前)暂停,等待你按回车键确认。

真实案例 :某次抓取“苹果发布会”资讯时,AI进入微信公众号页面后,因页面加载慢误判为“网络错误”,触发人工接管。你只需检查网络后按回车,AI即继续执行——既保证安全,又不失灵活性。

5.3 远程调试API:嵌入你自己的工作流

除了命令行,Open-AutoGLM提供Python API,可无缝集成到你的新闻监控系统中:

from phone_agent.agent import PhoneAgent
from phone_agent.adb import ADBConnection
# 初始化连接
conn = ADBConnection()
conn.connect("192.168.1.100:5555")  # 连接手机
# 创建AI代理
agent = PhoneAgent(
    device_id="192.168.1.100:5555",
    base_url="",
    model="autoglm-phone-9b"
)
# 每小时自动抓取一次热点
import schedule, time
def fetch_news():
    result = agent.run(
        "打开微博热搜榜,截图‘实时上升’区域,保存为 ./hourly/$(date +%H%M).png"
    )
    print(f"已保存 {result.screenshot_path}")
schedule.every().hour.at(":00").do(fetch_news)
while True:
    schedule.run_pending()
    time.sleep(60)

这段代码可部署在树莓派或云服务器上,实现7×24小时无人值守的热点监控。

6. 总结:从工具到工作流的思维升级

回顾整个实战过程,Open-AutoGLM带来的不仅是“自动化”,更是一种 信息处理范式的迁移

  • 过去 :你是信息的“搬运工”——在不同App间手动切换、复制、粘贴、截图;
  • 现在 :你是信息的“指挥官”——用一句话定义目标,AI负责执行所有中间环节,你只需关注最终产出的质量。

它解决了新闻工作者、市场分析师、自媒体创作者最痛的三个点:
跨平台割裂 :不再受限于单个App的算法茧房,真正实现全网视角;
时效性瓶颈 :从“发现热点”到“产出简报”压缩至3分钟内,快过人工10倍;
主观偏差 :AI按预设规则抓取,避免人为筛选导致的信息遗漏。

当然,它并非完美——当前对复杂网页(如知乎长文排版)、非标准UI(某些银行App的自定义控件)仍有识别盲区;模型响应速度受网络延迟影响。但这些正是技术演进的起点,而非终点。

下一步,你可以尝试:

本文标签: 调试 编程 系统

更多相关文章

192.168.0.1设备探索:零基础入门

8天前

有不少的用户在反馈,说在的时候,登录入口打不开找不到,从而无法对进行设置,问我应该怎么办? 根据鸿哥的经验来看,出现无法打开的登录入口问题,绝大数情况下是用户自己操作有误引起的,极少数情况

轻松搞定192.168.0.1,从初学者到高手的路由器设置技巧

8天前

摘 要 (导读:192.168.0.1路由器设置)1、路由器正确安装:2、IP地址设置3、登录路由器4、设置路由器目录本文将介绍192.168.0.1路由器设置的方法及教程;适用于小白新手换新路由器或者路" (导读

玩转Dism++,打造流畅的电脑体验

8天前

简介:Dism++是一款集成多种功能的Windows系统优化管理工具,提供从更新补丁管理到系统封装的一站式服务。它以高效、稳定和易用性获得了IT爱好者的广泛好评。本文将详细介绍Dism++的核心功能,包括系统更新补丁管理、垃圾清理、系

Dism助力:快速上手实现Flash Player无缝安装与更新

8天前

相关文章推荐:Windows ADK 下载地址: 命令示例:Gimagex图形化演示:以下命令由DISMGUI生成,原汁原味1.首次备份镜像【Captu

Dism命令教程:Adobe Flash Player安装与维护的简便方法

8天前

DISM(Deployment Image Servicing and Management)可以编辑WIM,安装,卸载,配置WinRE或者WinPE,也可以用来部署系统。它通常存在于C:Windowssystem32路径下(若是

让Dism++帮您驾驭Windows系统,轻松优化

8天前

简介:Dism++是一款先进的系统维护工具,专注于清理电脑垃圾、释放内存,提供全面的系统优化解决方案。最新版本Dism++10.1.1000.100_2d2bf466baca088c4b35248f5a7316f4e00cac0b特别

优化高手必备:Dism++系统管理全解析

7天前

简介:Dism++是一款集成多种功能的Windows系统优化管理工具,提供从更新补丁管理到系统封装的一站式服务。它以高效、稳定和易用性获得了IT爱好者的广泛好评。本文将详细介绍Dism++的核心功能,包括系统更新补丁管理、垃圾清理、系

一文读懂Dism命令行,Adobe Flash Player安装不再难!

7天前

相关文章推荐:Windows ADK 下载地址: 命令示例:Gimagex图形化演示:以下命令由DISMGUI生成,原汁原味1.首次备份镜像【Captu

告别Flash播放器错误,用DISM轻松搞定

7天前

在win10系统中,当系统出现文件受损或丢失后,可以使用DISM工具进行联机修复:1、使用管理员运行CMD: DISM Online Cleanup-image RestoreHealth命令会联机下载并修

破解Windows更新难题,0x800736cc不再是问题

7天前

在server 2012系统上安装IIS时报了一个错误,错误代码为0x800736cc,查了一下官方社区发现这个问题是系统被一些优化工具优化时或者一些其他操作造成了系统文件损坏,造成系统不能安装更新(安装IIS也是一个系统安装更新的过

Windows备份不求人:自助指南助你一臂之力

7天前

win系统环境搭建(十五)——如何将Windows系统备份 1.为什么要做备份?windows蓝屏警告!!!

Windows Server系统备份与恢复:实战教程

7天前

1、添加windows server backup功能 a)选择添加角色和功能 b)选择功能中勾选“windows server backup”,然后“下一步” c)安装功能 2、使用windows s

C盘大搬家?别怕,Ghost备份带你安全过!

7天前

推荐用U盘制作启动工具 大白菜or老毛桃 备份:以老毛桃为例,进入PE,点击左下角开始,可见ghost功能选项 运行Ghost后,单击“OK”。 选择“Local”→“Partition”→“

一次学透Ghost系统备份与恢复,保护你的电脑安全!

7天前

Ghost是赛门铁克公司推出的一个用于系统、数据备份与恢复的工具。其最新版本是Ghost11。但是自从Ghost9之后,它就只能在windows下面运行,提供数据定时备份、自动恢复与系统备份恢复的功能。本文将要介绍的

Adobe Flash Player的未来发展趋势预测

7天前

目录背景: 在日常的工作中,由于我的笔记本自带的SSD固态硬盘是512G的容量,平时下几个大型的文件或者资料就要快满了,于是决定换一个1TB的固态硬盘,换之前首先确认自己现在用的是什么类型的固态硬盘,推荐大家一款

老毛桃:你的个人数据保护小能手,备份恢复系统轻松搞定!

7天前

我们工作中难免遇到各种各样的问题,造成系统损坏、文件或数据丢失等等,为了快速恢复我们的数据,我们应该习惯性的备份系统和数据,以免造成不必要的损失,正所谓“数据无价”。 我前两天就吃了没备份的亏咯,数据全没了,试想一下这要是

GHOST教程:系统备份和还原,小白也能变成高手!

7天前

一、备份的概述1、定义:对关键系统、硬件等数据进行复制,当发生灾难时能快速的恢复原有数据,保证系统的正常稳定2、备份的方式外部冗余设备      (移动硬盘或U盘复制了电脑上重要数据)硬

省时省心!三步完成电脑系统高效备份!

7天前

电脑系统备份方法 当今时下系统备份已经越来越被广大网友们所使用,做好了系统备份,就相当于给你的电脑系统加了一个保护伞或者买了份保险。 电脑系统备份的重要性已经尤为明显,提前做好了 的朋友可以不用担心电脑

Ubuntu系统安全大计,备份技巧大公开

7天前

本文主要参考这个博客。全文一半内容是复制粘贴的这个博客内容,提前声明一下,以防侵权。还参考了下这个ubuntu有时候用着用着崩了,或者想回退到历史某个版本。这就需要系统备份了:把当前某个能用的状态备

Ubuntu系统维护秘籍:备份步骤详解,保护你的劳动成果!

7天前

记录ubuntu的系统备份方法: 测试平台:ubuntu16.04,已安装nvidia384 cuda opencv protobuf等等运算库。使用ubuntu时经常需要重新安装电脑,和windows不一样的

发表评论

全部评论 0
暂无评论