admin 管理员组文章数量: 1184232
网络爬虫之多平台浏览器驱动下载地址分享
- 一、爬虫与浏览器驱动简介
- 1.1爬虫简介
- 1.1.1爬虫分类
- 1.1.2爬虫应用
- 1.2浏览器驱动简介
- 二、windows、linux、mac平台下载地址
- 2.1windows平台下载地址
- 2.2linux、mac平台下载地址
- 三、arm平台下载地址
- 参考文档
一、爬虫与浏览器驱动简介
1.1爬虫简介
网络爬虫(也称为网页蜘蛛、网络机器人)是一种按照一定规则自动抓取互联网信息的程序或脚本。它们可以自动化地浏览网络中的信息,并将这些信息存储到本地计算机上。
网络爬虫通常从一组初始URL开始,访问这些链接并识别页面中的所有超链接,然后将这些链接添加到待抓取的URL列表中。爬虫会按照一定的策略反复访问这些URL,直到满足系统的停止条件。
1.1.1爬虫分类
网络爬虫的分类:
- 网络爬虫主要分为以下几种类型:
- 通用网络爬虫:这种爬虫会抓取整个互联网中的网页,主要用于搜索引擎,如百度、谷歌等。
- 聚焦网络爬虫:这种爬虫只抓取与特定主题相关的网页,节省了带宽和服务器资源。
- 增量式网络爬虫:这种爬虫只更新已抓取网页中发生变化的部分,保证数据的新鲜度。
- 深层网络爬虫:这种爬虫可以抓取隐藏在表单后的深层网页。
1.1.2爬虫应用
网络爬虫在大数据时代具有重要地位,广泛应用于以下领域:
- 搜索引擎:如百度、谷歌等搜索引擎使用爬虫抓取网页并建立索引,以提供快速的搜索服务。
- 数据分析与挖掘:爬虫可以自动采集数据,用于数据分析和挖掘。
- 金融分析:爬虫可以采集金融数据,进行投资分析。
- 舆情监测:爬虫可以监测和分析网络舆情。
1.2浏览器驱动简介
在使用一些自动化网页测试工具时,往往需要下载谷歌浏览器驱动文件,用于配合工具进行自动化网页操作,所以本文汇总了windows、linux、mac、arm平台下谷歌浏览器驱动的下载地址,以提高读者的工作学习效率。
二、windows、linux、mac平台下载地址
2.1windows平台下载地址
windows平台下的谷歌浏览器驱动大版本号必须与浏览器的大版本号相同,例如浏览器是128版本,那么就需要下载128版本的驱动,最新版驱动下载地址为:https://googlechromelabs.github.io/chrome-for-testing/。
该网页包含了Stable(稳定版)、Beta(测试版)、Dev(开发版)、Canary(金丝雀版)四种版本的最新版,通常下载Stable(稳定版)。
截至文章发布时,稳定版驱动最新版本为128版本。
128版本至114版本的驱动下载地址为:https://registry.npmmirror/binary.html?path=chrome-for-testing/,该地址并不是谷歌官方地址,而是一个镜像地址。
114版本之前的驱动下载地址为:https://chromedriver.storage.googleapis/index.html。
2.2linux、mac平台下载地址
linux与mac平台下的驱动下载地址与上述windows平台下的驱动下载地址一致,但驱动版本是否必须与浏览器版本的大版本号相同未经实际测试。
三、arm平台下载地址
arm平台下的驱动下载地址为:https://registry.npmmirror/binary.html?path=electron/,其中的驱动文件并不是谷歌官方开发的,而是GitHub上的一个开源项目开发的,源项目地址为:https://github/electron/electron。
该开源项目开发的arm驱动版本号命名并不依照谷歌浏览器的版本号体系命名,经过测试其中几个驱动文件,具体对应关系如下表:
| arm驱动大版本号 | 谷歌浏览器大版本号 |
|---|---|
| v28 | v120 |
| v29 | v122 |
| v30 | v124 |
| v31 | v126 |
经过实际测试发现,arm驱动对应的谷歌浏览器大版本号不需要与浏览器的大版本号相同,例如下载v30的驱动可以与v126的浏览器相配合进行自动化网页测试。
参考文档
Chrome115版本及之后的chromedriver的终极解决办法
版权声明:本文标题:网络爬虫之多平台浏览器驱动下载地址分享 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/b/1766500858a3464299.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论