admin 管理员组

文章数量: 1184232

Open-AutoGLM新闻聚合场景:热点资讯自动抓取实战

1. 为什么手机端AI Agent正在改变信息获取方式

你有没有过这样的经历:早上通勤路上想快速了解昨夜全球发生了什么,却在十几个新闻App之间反复切换、手动刷新、点开又关闭?或者想追踪某条突发社会事件的进展,却要不断在微博、小红书、抖音、微信公众号之间来回跳转,眼花缭乱还漏掉关键信息?

传统新闻聚合依赖RSS订阅或平台算法推荐,但它们无法理解“我想看今天上海暴雨对地铁运营的实际影响”这种带时空约束、多源交叉、需上下文判断的复杂需求。而Open-AutoGLM——智谱开源的手机端AI Agent框架,正试图从根本上解决这个问题。

它不是另一个新闻App,而是一个能真正“读懂屏幕、理解意图、自主操作”的数字助手。当你对它说“把过去24小时内所有关于‘杭州亚运会闭幕式’的短视频和图文报道,按热度排序整理成一份简报”,它不会只打开某个App搜索关键词,而是会依次进入抖音、小红书、B站、微信视频号,识别界面元素、滑动加载内容、截图关键信息、提取文字摘要,最后用自然语言生成结构化简报——整个过程无需你碰一下手机。

这背后不是简单的自动化脚本,而是视觉语言模型(VLM)+任务规划+ADB设备控制三位一体的能力融合。本文将带你从零开始,在真实安卓设备上部署Open-AutoGLM,并完成一个极具实用价值的落地场景: 热点资讯自动抓取与聚合 。不讲抽象架构,只聚焦你能立刻上手、当天就能用起来的完整链路。

2. Open-AutoGLM核心能力解析:它到底能做什么

2.1 不是“语音助手”,而是“屏幕级智能体”

很多人第一反应是:“这不就是Siri或小爱同学的升级版?”——恰恰相反。传统语音助手本质是“命令-响应”模式:你说“打开微信”,它调用系统API启动应用;你说“发消息给张三”,它调起微信聊天界面。它 不看屏幕,不理解界面,不感知当前状态

而Open-AutoGLM的Phone Agent框架,核心突破在于引入了 视觉闭环

  • 看得到 :通过ADB截屏,将手机当前界面实时传给视觉语言模型(如AutoGLM-Phone-9B),模型不仅能识别按钮、输入框、标题栏等UI元素,还能理解“这个红色感叹号图标代表未读消息”、“顶部搜索框下方的‘综合’‘视频’‘用户’是筛选标签”;
  • 想得清 :接收到“打开小红书搜美食”指令后,它先做意图分解——“打开小红书”是启动应用,“搜美食”是后续动作;再做界面推理——当前是否已在小红书首页?若在微信聊天界面,则需先返回桌面、找到小红书图标、点击进入,再定位搜索框;
  • 做得准 :通过ADB发送精确坐标点击、滑动、长按、输入文本等指令,每一步都基于对当前屏幕的理解动态决策,而非预设固定路径。

这意味着,它能处理 登录态变化、弹窗拦截、验证码跳转、页面加载延迟 等真实手机使用中的“毛刺问题”,这是纯API调用方案永远无法覆盖的长尾场景。

2.2 新闻聚合场景的独特适配性

为什么新闻聚合是Open-AutoGLM的“天选场景”?我们对比三个典型需求:

需求描述 传统方案痛点 Open-AutoGLM解决方案
“汇总昨晚世界杯决赛的球迷反应” 需手动打开微博热搜榜、抖音热榜、小红书话题页,逐个截图、复制评论,耗时20分钟以上 AI自动进入各平台热榜页,识别“#世界杯决赛”话题卡片,滑动加载前50条评论,提取情绪关键词(激动/失望/调侃),生成300字舆情摘要
“查今天北京地铁10号线早高峰延误原因” 在北京地铁App查不到实时延误,需翻微博搜“北京地铁10号线”,人工筛选官方通报、乘客实拍、交通委回应 AI自动搜索“北京地铁10号线”,优先识别北京地铁官微、@北京交通、本地大V账号的最新图文,过滤广告和无关转发,提取时间、地点、原因、预计恢复时间四要素
“对比iPhone16发布会三家科技媒体的首评重点” 打开中关村在线、爱范儿、少数派App,分别查找对应文章,手动比对“影像升级”“电池续航”“价格策略”三个维度的表述差异 AI并行打开三家媒体App,定位发布会专题页,精准提取每篇首评中关于三个维度的首段结论句,以表格形式横向对比,标出共识与分歧点

这些任务共同特点是: 跨App、强时效、需语义理解、容错要求高 ——恰好是Open-AutoGLM多模态感知+自主规划能力的发挥空间。

3. 本地环境搭建:从零连接你的真机

3.1 硬件与基础工具准备

这不是一个仅靠“pip install”就能跑起来的Python库,而是一套需要软硬协同的系统。请确保以下四项全部就绪:

  • 一台Windows或macOS电脑 :作为控制端,运行Python代码并管理ADB连接;
  • 一部Android 7.0+真机 (强烈建议不用模拟器):新闻聚合需真实App生态,模拟器无法安装小红书、抖音等主流应用;
  • USB数据线 :用于首次ADB配对与调试;
  • 稳定的WiFi网络 :用于后续无线控制,避免USB线缆束缚。

关键提醒 :不要跳过“真机”要求。模拟器缺少传感器、通知栏、后台服务等真实环境要素,会导致AI在识别“下拉通知栏查看新消息”或“从后台切回抖音”等操作时失败。

3.2 ADB环境配置:让电脑真正“看见”手机

ADB(Android Debug Bridge)是连接电脑与安卓设备的桥梁。配置不成功,后续所有操作都是空中楼阁。

Windows用户:
  1. 下载 压缩包,解压到 C:\adb
  2. Win + R → 输入 sysdm.cpl → “高级”选项卡 → “环境变量” → 在“系统变量”中找到 Path → “编辑” → “新建” → 添加 C:\adb
  3. 打开命令提示符,输入 adb version ,看到类似 Android Debug Bridge version 1.0.41 即成功。
macOS用户:
  1. 终端执行:
# 假设下载解压到 ~/Downloads/platform-tools
export PATH=$PATH:~/Downloads/platform-tools
# 永久生效:将上行添加到 ~/.zshrc 或 ~/.bash_profile
echo 'export PATH=$PATH:~/Downloads/platform-tools' >> ~/.zshrc
source ~/.zshrc
  1. 终端输入 adb version 验证。

3.3 手机端深度设置:解锁AI操控权限

仅开启USB调试远远不够,还需三项关键配置:

  1. 开启开发者模式
    设置 → 关于手机 → 连续点击“版本号”7次 → 输入锁屏密码 → 提示“您现在处于开发者模式”。

  2. 启用USB调试与网络调试
    设置 → 系统 → 开发者选项 → 勾选:

    • USB调试
    • USB调试(安全设置)
    • 网络ADB调试(为WiFi控制铺路)
  3. 安装ADB Keyboard(解决输入难题)

    • 下载 并安装;
    • 设置 → 语言与输入法 → 当前键盘 → 选择“ADB Keyboard”;
    • 重要 :在“已启用的键盘”中确保其被勾选,否则AI无法向搜索框输入文字。

避坑指南 :部分国产手机(华为、小米)有额外限制:

  • 华为需在“开发者选项”中关闭“仅充电模式下允许ADB调试”;
  • 小米需在“开发者选项”中开启“USB安装”和“USB调试(安全设置)”;
  • adb devices 显示 unauthorized ,请在手机弹出的授权对话框中点击“允许”。

4. 部署与运行:让AI开始为你抓取新闻

4.1 控制端代码部署

在本地电脑执行以下命令(确保已安装Git):

# 克隆官方仓库
git clone 
cd Open-AutoGLM
# 创建虚拟环境(推荐,避免依赖冲突)
python -m venv venv
source venv/bin/activate  # macOS/Linux
# venv\Scripts\activate  # Windows
# 安装依赖
pip install --upgrade pip
pip install -r requirements.txt
pip install -e .

此时,你的本地环境已具备调用Phone Agent的所有能力,但注意: 模型推理本身不在本地运行 。Open-AutoGLM采用“轻客户端+重云端”架构——控制逻辑在你电脑,而耗资源的视觉语言模型在云服务器上。你需要一个已部署好的AutoGLM-Phone服务端(可通过CSDN星图镜像广场一键获取)。

4.2 设备连接实战:USB与WiFi双模式

USB直连(推荐首次调试)
  1. 用USB线连接手机与电脑;
  2. 电脑终端执行:
adb devices

若输出类似 0123456789ABCDEF device ,说明连接成功; 3. 记下设备ID(如 0123456789ABCDEF ),后续命令中 --device-id 参数即为此值。

WiFi无线连接(日常使用首选)
  1. 确保手机与电脑在同一WiFi下;
  2. 首次需USB连接执行:
adb tcpip 5555  # 切换ADB到TCP模式
  1. 拔掉USB线,查看手机WiFi IP(设置 → WLAN → 点击当前网络 → IP地址),假设为 192.168.1.100
  2. 电脑执行:
adb connect 192.168.1.100:5555
adb devices  # 应显示 192.168.1.100:5555 device

稳定性提示 :WiFi连接偶尔会断开,若 adb devices 显示 offline ,只需重新执行 adb connect 192.168.1.100:5555 即可,无需插拔USB。

4.3 启动热点资讯抓取任务

假设你已在云服务器部署好AutoGLM-Phone服务,公网IP为 203.107.123.45 ,vLLM服务映射端口为 8800 ,则执行:

python main.py \
  --device-id 0123456789ABCDEF \
  --base-url  \
  --model "autoglm-phone-9b" \
  "打开微博热搜榜,找到‘上海暴雨’话题,截图前三条讨论,再打开小红书搜索‘上海暴雨应对’,保存前两条笔记封面和标题"
命令参数详解:
  • --device-id :你的设备唯一标识, adb devices 第一列内容;
  • --base-url :云服务地址,格式必须为 ,末尾 /v1 不可省略;
  • 最后字符串: 自然语言指令 ,越具体越好。避免模糊表述如“看看新闻”,应明确平台、动作、目标(如“打开抖音→搜索‘台风海葵’→进入第1个视频→截图评论区前3条”)。
实际运行效果:

你会看到终端实时打印AI的思考过程:

[INFO] 当前界面:手机桌面 → 正在定位小红书图标...
[INFO] 已点击小红书图标 → 等待应用启动...
[INFO] 当前界面:小红书首页 → 正在定位搜索框...
[INFO] 已点击搜索框 → 输入‘上海暴雨应对’...
[INFO] 当前界面:搜索结果页 → 正在滑动加载...
[INFO] 已截图第1条笔记封面 → 保存为 ./output/note1_cover.png
[INFO] 已提取第1条笔记标题:《上海暴雨自救指南,亲测有效!》
...
[SUCCESS] 任务完成,共获取4张截图、6条标题,结果存于 ./output/

所有截图与文本均自动保存至本地 ./output/ 目录,可直接用于制作简报。

5. 新闻聚合进阶技巧:让AI更懂你的需求

5.1 指令工程:用“三要素法”写出高质量指令

AI不是万能的,清晰的指令是高效执行的前提。我们总结出新闻抓取专用的“三要素指令公式”:

平台 + 动作 + 目标锚点

  • ❌ 差:“看看最近的科技新闻”(无平台、无动作、无目标)
  • 优:“在36氪App首页,下滑加载‘最新’栏目,截取前3篇标题含‘AI芯片’的文章封面和导语”

实践技巧

  • 指定平台 :优先用大众App(微博、抖音、小红书、微信公众号),避免冷门平台导致AI找不到入口;
  • 限定动作 :用“截图”“提取文字”“保存链接”“记录发布时间”等可量化动词;
  • 锚定目标 :用“前3条”“含XX关键词”“评论数>1000”“发布时间在2小时内”等条件缩小范围。

5.2 敏感操作安全机制:防止误触的双重保险

新闻抓取可能涉及账号登录、支付页面等敏感场景。Open-AutoGLM内置两层防护:

  1. 自动确认机制 :当AI检测到“登录”“支付”“删除”等高危UI元素(如红色“确认支付”按钮、弹窗“是否退出登录”),会暂停执行并输出提示:
    [ALERT] 检测到支付按钮,为保障安全,已暂停执行。请手动确认后输入 'continue' 继续,或 'abort' 中止。
    
  2. 人工接管接口 :在 main.py 中设置 --manual-intervention 参数,AI会在每个关键步骤(如点击搜索框前、截图前)暂停,等待你按回车键确认。

真实案例 :某次抓取“苹果发布会”资讯时,AI进入微信公众号页面后,因页面加载慢误判为“网络错误”,触发人工接管。你只需检查网络后按回车,AI即继续执行——既保证安全,又不失灵活性。

5.3 远程调试API:嵌入你自己的工作流

除了命令行,Open-AutoGLM提供Python API,可无缝集成到你的新闻监控系统中:

from phone_agent.agent import PhoneAgent
from phone_agent.adb import ADBConnection
# 初始化连接
conn = ADBConnection()
conn.connect("192.168.1.100:5555")  # 连接手机
# 创建AI代理
agent = PhoneAgent(
    device_id="192.168.1.100:5555",
    base_url="",
    model="autoglm-phone-9b"
)
# 每小时自动抓取一次热点
import schedule, time
def fetch_news():
    result = agent.run(
        "打开微博热搜榜,截图‘实时上升’区域,保存为 ./hourly/$(date +%H%M).png"
    )
    print(f"已保存 {result.screenshot_path}")
schedule.every().hour.at(":00").do(fetch_news)
while True:
    schedule.run_pending()
    time.sleep(60)

这段代码可部署在树莓派或云服务器上,实现7×24小时无人值守的热点监控。

6. 总结:从工具到工作流的思维升级

回顾整个实战过程,Open-AutoGLM带来的不仅是“自动化”,更是一种 信息处理范式的迁移

  • 过去 :你是信息的“搬运工”——在不同App间手动切换、复制、粘贴、截图;
  • 现在 :你是信息的“指挥官”——用一句话定义目标,AI负责执行所有中间环节,你只需关注最终产出的质量。

它解决了新闻工作者、市场分析师、自媒体创作者最痛的三个点:
跨平台割裂 :不再受限于单个App的算法茧房,真正实现全网视角;
时效性瓶颈 :从“发现热点”到“产出简报”压缩至3分钟内,快过人工10倍;
主观偏差 :AI按预设规则抓取,避免人为筛选导致的信息遗漏。

当然,它并非完美——当前对复杂网页(如知乎长文排版)、非标准UI(某些银行App的自定义控件)仍有识别盲区;模型响应速度受网络延迟影响。但这些正是技术演进的起点,而非终点。

下一步,你可以尝试:

本文标签: 系统 编程 新闻聚合

更多相关文章

告别重装系统,用DISM轻松解决电脑问题

7天前

介绍了解: DISM(部署映像服务和管理)是三种 Windows 诊断工具中最强大的。当遇到频繁的崩溃、冻结和错误,或者 SFC 要么无法修复您的系统文件,或者根本无法运行时,可以使用该工具。 相连文章: 修复

从0到1:Dism++教你快速完成系统安装,新手必备技能!

7天前

系统安装是一个简单而又复杂的活。有的仅仅为了安装系统,先把ESD转为ISO。 有的因为安装器不支持ESD,而转换为WIM。还有的在解压ISO……反正各种心烦 本文将通过一些实例,帮助大家驾驭Dism 。 目录

玩转Dism++,打造流畅的电脑体验

7天前

简介:Dism++是一款集成多种功能的Windows系统优化管理工具,提供从更新补丁管理到系统封装的一站式服务。它以高效、稳定和易用性获得了IT爱好者的广泛好评。本文将详细介绍Dism++的核心功能,包括系统更新补丁管理、垃圾清理、系

Windows系统维护新纪元:Dism命令的高效应用实践

7天前

Dism是什么? dism 命令(Deployment Image Servicing and Management)是Windows操作系统中的一个命令行工具,用于管理和维护映像文件(如Windows安装映像或修复映像)。d

揭秘Dism日志:解锁Windows系统维护的终极武器

7天前

使用DISM命令修复系统注意:DISM命令只会修复系统自带的文件,第三方软件、驱动问题使用此命令修复是无效的,修复过程是比较漫长的,但是修复期间不会影响你系统正常使用、也不会卡什么的,占用资源比较低。 一、检查映像

DISM++:你的Flash播放问题终结者,提升性能

7天前

简介:DISM++是一款全方位的电脑维护软件,提供深度扫描和清理功能,专为优化个人计算机而设计。它能够高效清除各种系统垃圾和无用文件,释放硬盘空间,并通过系统清理、优化、备份和恢复功能提高电脑的运行速度和性能。该软件还支持多语言界面,

一招搞定电脑卡顿?Dism++优化技巧大公开

7天前

1.系统文件清理 虽然dism的文件清理比较弱,但相对于其他清理工具来说,清理系统垃圾文件功能比较丰富,选择软件的空间回收栏目,勾选所有的清理功能,点击扫描,稍等片刻,即可扫描出不需要的文件,点击清理即可。 其中需要注

0x800736cc让你头疼?用DISM让你的Windows更新畅通无阻

7天前

在server 2012系统上安装IIS时报了一个错误,错误代码为0x800736cc,查了一下官方社区发现这个问题是系统被一些优化工具优化时或者一些其他操作造成了系统文件损坏,造成系统不能安装更新(安装IIS也是一个系统安装更新的过

Dism++x64全面解析:告别臃肿系统,C盘焕发新生的全面优化方案

7天前

一、 为什么技术人都要用 Dism++? 在 Windows 运维和优化领域, Dism++被称为“全球第一款基于 CBS 的 Dism GUI 实现”。 对于普通用户,这可能听起来很拗口。简单

掌握Windows 10的Dism技巧,让系统管理更高效、更便捷

7天前

目录一、DISM是什么 DISM,英文名称为Deployment Imaging and Management,部署映像服务和管理。这是一个命令行工具,用于部署前从.wim文件、.ffu文件、.vhd文件或.vh

告别Flash播放器错误,用DISM轻松搞定

7天前

在win10系统中,当系统出现文件受损或丢失后,可以使用DISM工具进行联机修复:1、使用管理员运行CMD: DISM Online Cleanup-image RestoreHealth命令会联机下载并修

告别繁琐,Dism++一键卸载驱动,让电脑运行更流畅

7天前

资源说明 Dism++(系统精简利器)是一款功能全面的Windows系统精简工具,在某种程度上可以说是以前的Dism管理器的升级版(最开始的名字叫Windows更新清理工具),Dism++(系统精简利器)全新的构建,更小的体积

Dism++:你的日常维护与系统优化好帮手

7天前

简介:Dism++是一款先进的系统维护工具,专注于清理电脑垃圾、释放内存,提供全面的系统优化解决方案。最新版本Dism++10.1.1000.100_2d2bf466baca088c4b35248f5a7316f4e00cac0b特别

Dism++:Flash中心的高效解决方案,让你的电脑焕然一新

7天前

无需全家桶,不占内存,5MB的绿色工具让你的Windows流畅如新!在Windows系统长期使用过程中,系统臃肿、运行卡顿、C盘爆满等问题困扰着绝大多数用户。面对这些痛点,很多人的第一反应是重装系统,但今天我将介绍一款更

CentOS系统备份攻略:避免数据丢失的不二法门

7天前

CentOS 是一种广泛使用的 Linux 操作系统,对于保护系统和数据的安全,定期备份是非常重要的。本文将介绍如何备份 CentOS 系统,包括文件和配置。完整系统备份完整系统备份是一种将整个 CentOS

一次学透Ghost系统备份与恢复,保护你的电脑安全!

7天前

Ghost是赛门铁克公司推出的一个用于系统、数据备份与恢复的工具。其最新版本是Ghost11。但是自从Ghost9之后,它就只能在windows下面运行,提供数据定时备份、自动恢复与系统备份恢复的功能。本文将要介绍的

Linux备份与恢复必修课:SWF文件安全策略从入门到精通

7天前

在linux工作,系统备份是很有必要的,养成系统备份的好习惯会提高你的工作效率。下面我就简单的说一下:1.备份系统首先成为root用户:sudo su然后进入文件系统的根目录

Linux系统不哭:高效备份与快速恢复方案

7天前

备份系统1.先切换到root用户sudosu 2.进入根目录tar cvpzf backup.tgz --exclude=proc --exclude=lost+found --exclude=ba

Win10系统备份轻松搞定:掌握captureimage命令的关键技巧

7天前

Win10自带的备份工具备份系统Windows操作系统经过从win98,win2000,winxp,win7,win8到win10的不断更新和完善,功能已经非常强大、完备了。但伴随着微软把重点转移到云端,对更新维护不再保

Ubuntu系统维护秘籍:备份步骤详解,保护你的劳动成果!

7天前

记录ubuntu的系统备份方法: 测试平台:ubuntu16.04,已安装nvidia384 cuda opencv protobuf等等运算库。使用ubuntu时经常需要重新安装电脑,和windows不一样的

发表评论

全部评论 0
暂无评论