admin 管理员组文章数量: 1184232
selenium可以模拟真实浏览器,自动化测试工具,支持多种浏览器,爬虫中主要用来解决JavaScript渲染问题。
安装:
pip install selenium下载chromedriver时,chromedriver官网打不开的话,可以去淘宝镜像,地址:,使用最新的chromedriver可以避免一些未知错误(我用旧版的就报错了:WebDriverException: unknown error: call function result missing 'value')
from selenium import webdriver
driver = webdriver.Chrome()
driver.get(')在 Python 下引用 Selenium 包开发时,报错:WebDriverException: 'chromedriver' executable needs to be in PATH.
安装 selenium 的 python 包之后,还要安装浏览器 driver,下载安装了ChromeDriver后,将其路径添加到/usr/local/bin下,仍然报错,重新添加PATH,也报错。最后解决办法为:
复制 chromedrive 文件到 Google Chrome 程序目录下,
将
driver = webdriver.Chrome()改为:
driver = webdriver.Chrome("/Applications/Google Chrome.app/Contents/MacOS/chromedriver")即可正常运行。
Selenium的优缺点
优点: Selenium可以爬取任何网页的任何内容,因为它是通过浏览器访问的方式进行数据的爬取,没有网站会拒绝浏览器的访问。
版权声明:本文标题:Python爬虫(入门+进阶)学习笔记 1-8 使用自动化神器Selenium爬取动态网页(案例三:爬取淘宝商品) 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/b/1774358707a3570822.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论