admin 管理员组

文章数量: 1184232

网络爬虫之多平台浏览器驱动下载地址分享

  • 一、爬虫与浏览器驱动简介
    • 1.1爬虫简介
      • 1.1.1爬虫分类
      • 1.1.2爬虫应用
    • 1.2浏览器驱动简介
  • 二、windows、linux、mac平台下载地址
    • 2.1windows平台下载地址
    • 2.2linux、mac平台下载地址
  • 三、arm平台下载地址
  • 参考文档

一、爬虫与浏览器驱动简介

1.1爬虫简介

网络爬虫(也称为网页蜘蛛、网络机器人)是一种按照一定规则自动抓取互联网信息的程序或脚本。它们可以自动化地浏览网络中的信息,并将这些信息存储到本地计算机上。
网络爬虫通常从一组初始URL开始,访问这些链接并识别页面中的所有超链接,然后将这些链接添加到待抓取的URL列表中。爬虫会按照一定的策略反复访问这些URL,直到满足系统的停止条件。

1.1.1爬虫分类

网络爬虫的分类:

  1. 网络爬虫主要分为以下几种类型:
  2. 通用网络爬虫:这种爬虫会抓取整个互联网中的网页,主要用于搜索引擎,如百度、谷歌等。
  3. 聚焦网络爬虫:这种爬虫只抓取与特定主题相关的网页,节省了带宽和服务器资源。
  4. 增量式网络爬虫:这种爬虫只更新已抓取网页中发生变化的部分,保证数据的新鲜度。
  5. 深层网络爬虫:这种爬虫可以抓取隐藏在表单后的深层网页。

1.1.2爬虫应用

网络爬虫在大数据时代具有重要地位,广泛应用于以下领域:

  1. 搜索引擎:如百度、谷歌等搜索引擎使用爬虫抓取网页并建立索引,以提供快速的搜索服务。
  2. 数据分析与挖掘:爬虫可以自动采集数据,用于数据分析和挖掘。
  3. 金融分析:爬虫可以采集金融数据,进行投资分析。
  4. 舆情监测:爬虫可以监测和分析网络舆情。

1.2浏览器驱动简介

在使用一些自动化网页测试工具时,往往需要下载谷歌浏览器驱动文件,用于配合工具进行自动化网页操作,所以本文汇总了windows、linux、mac、arm平台下谷歌浏览器驱动的下载地址,以提高读者的工作学习效率。

二、windows、linux、mac平台下载地址

2.1windows平台下载地址

windows平台下的谷歌浏览器驱动大版本号必须与浏览器的大版本号相同,例如浏览器是128版本,那么就需要下载128版本的驱动,最新版驱动下载地址为:https://googlechromelabs.github.io/chrome-for-testing/。

该网页包含了Stable(稳定版)、Beta(测试版)、Dev(开发版)、Canary(金丝雀版)四种版本的最新版,通常下载Stable(稳定版)

截至文章发布时,稳定版驱动最新版本为128版本

128版本至114版本的驱动下载地址为:https://registry.npmmirror/binary.html?path=chrome-for-testing/,该地址并不是谷歌官方地址,而是一个镜像地址。

114版本之前的驱动下载地址为:https://chromedriver.storage.googleapis/index.html。

2.2linux、mac平台下载地址

linux与mac平台下的驱动下载地址与上述windows平台下的驱动下载地址一致,但驱动版本是否必须与浏览器版本的大版本号相同未经实际测试。

三、arm平台下载地址

arm平台下的驱动下载地址为:https://registry.npmmirror/binary.html?path=electron/,其中的驱动文件并不是谷歌官方开发的,而是GitHub上的一个开源项目开发的,源项目地址为:https://github/electron/electron。

该开源项目开发的arm驱动版本号命名并不依照谷歌浏览器的版本号体系命名,经过测试其中几个驱动文件,具体对应关系如下表:

arm驱动大版本号谷歌浏览器大版本号
v28v120
v29v122
v30v124
v31v126

经过实际测试发现,arm驱动对应的谷歌浏览器大版本号不需要与浏览器的大版本号相同,例如下载v30的驱动可以与v126的浏览器相配合进行自动化网页测试。

参考文档

Chrome115版本及之后的chromedriver的终极解决办法

本文标签: 下载地址 爬虫 之多 浏览器 平台