首页编程正文内容

使用Python代码轻松捕获和保存HTML中的图像资源。

编程

更新时间：2026-04-04 01:32:16 15

admin 管理员组

文章数量: 1184232

Python保存网页图片这个是个比较简单的例子，网页中的图片地址都是使用'http://。。。。.jpg'这种方式直接定义的。

使用前，可以先建立好一个文件夹用于保存图片，本例子中使用的文件夹是 d:\\pythonPath这个文件夹

代码如下：

# -*- coding: UTF-8 -*-

import os,re,urllib,uuid

#首先定义云端的网页,以及本地保存的文件夹地址

urlPath='

localPath='d:\\pythonPath'

#从一个网页url中获取图片的地址，保存在

#一个list中返回

def getUrlList(urlParam):

urlStream=urllib.urlopen(urlParam)

htmlString=urlStream.read()

if( len(htmlString)!=0 ):

patternString=r'

searchPattern=re.compile(patternString)

imgUrlList=searchPattern.findall(htmlString)

return imgUrlList

#生成一个文件名字符串

def generateFileName():

return str(uuid.uuid1())

#根据文件名创建文件

def createFileWithFileName(localPathParam,fileName):

totalPath=localPathParam+'\\'+fileName

if not os.path.exists(totalPath):

file=open(totalPath,'a+')

file.close()

return totalPath

#根据图片的地址，下载图片并保存在本地

def getAndSaveImg(imgUrl):

if( len(imgUrl)!= 0 ):

fileName=generateFileName()+'.jpg'

urllib.urlretrieve(imgUrl,createFileWithFileName(localPath,fileName))

#下载函数

def downloadImg(url):

urlList=getUrlList(url)

for urlString in urlList:

getAndSaveImg(urlString)

downloadImg(urlPath)

保存的文件如下：

网页的一部分保存为图片主要思路是selenium+phantomjs(中文网页需要设置字体)+PIL切图

def webscreen():

url = '

driver = webdriver.PhantomJS()

driver.set_page_load_timeout(300)

driver.set_window_size(1280,800)

driver.get(url)

imgelement = driver.find_element_by_id('XXXX')

location = imgelement.location

size = imgelement.size

savepath = r'XXXX.png'

driver.save_screenshot(savepath)

im = Image.open(savepath)

left = location['x']

top = location['y']

right = left + size['width']

bottom = location['y'] + size['height']

im = im.crop((left,top,right,bottom))

im.save(savepath)

本文标签：使用保存的文代码轻松

版权声明：本文标题：使用Python代码轻松捕获和保存HTML中的图像资源。内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.roclinux.cn/b/1770850428a3538282.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

掌握MuJoCo与MJX：物理仿真从理论到实践的可视化与数据交互指南

技术日记

22天前

突破物理仿真瓶颈：MuJoCo与MJX的可视化与数据交互全攻略你是否在开发机器人控制算法时，遇到过仿真速度慢、数据难以可视化的问题？本文将带你掌握MuJoCo与MJX结合使用的核心技术，通过高效的可视化工具和数据交互方法，让

从代码到执行：ActivePerl助你免费编译Perl源码为高效程序

技术日记

20天前

perl是解释型的语言，只要perl环境安装好，就可以直接解释代码执行，但有时想把perl代码编译成exe可执行程序，以脱离perl解释器独立执行，一般可以使用perl2exe和Perl Dev Kit，但是这两个工具要么不好找，要么

让Dell笔记本变安静，掌握粉丝控制技巧，告别烦人的噪音

编程

20天前

还在被Dell笔记本风扇的"高速运转模式"困扰吗？我们都有过这样的经历——专注工作时风扇突然狂转，游戏关键时刻散热不足导致降频。今天，让我们一起探索如何通过DellFanManagement这款开源工具，彻底解决风扇控制

如何在Linux中调整系统时间？超详细步骤解析

技术日记

20天前

在 Linux 系统中，可以通过不同的方法来设置系统时间，下面详细介绍几种常见的方式。目录方法一：使用date命令手动设置时间 date命令是一个简单且常用的用于显示和设置系统时间的工具。

GTA5加速利器：YimMenu快速配置指南，十分钟内让游戏如丝般顺滑

编程

20天前

终极YimMenu配置指南：10分钟搞定GTA5游戏增强 YimMenu配置作为目前最受欢迎的GTA5辅助工具之一，为玩家提供了全面的游戏增强功能。这款开源项目拥有强大的安全保护机制，能够有效防止常见的游戏崩溃问题，同时大幅提

告别软驱束缚，体验vFloppy v1.5的虚拟启动魅力

技术日记

19天前

简介：vFloppy v1.5是一个创新的系统工具，支持在没有物理软盘驱动器的计算机上实现启动和dos环境下的NTFS文件系统操作。它通过集成启动映像文件，允许用户在无需物理介质的情况下进行系统恢复、安装及特定dos工具操作。软件还支

7月22日：网约车行业的新挑战：司机违规使用‘作弊器’

技术日记

19天前

前言：提取了一些某音视频的干货文案，分享给大家原视频3.53 0116 F@U.yG ATl: 2024年7月22日信息差丨网约车司机使用“作弊器” # 热点新闻事件# 每日新闻复制此链接，打开Dou音

Ubuntu中启动不了Windows？看这篇教程修复双系统！

技术日记

18天前

********本文章是原创，转载请注明*******1.windows平台下可使用easyBCD,安装时打开，可能是弹出“BCD注册表错误” （我的另一篇帖子有讲，如何解决）2.linux系统下（我个人用

老毛桃装机教程实测：面对失败，如何寻找问题的关键点？

编程

18天前

目的就是用老毛桃安装win10系统。好久不用这些东西了，因为系统装了之后，就很少动了；今天新同事要重装系统，我就帮助重新装了一下，顺便记录一下用法。过程很简单，重点说一下装机过程中遇上的问

“Mac用户福音！忘记管理员密码？这里有快速解决方法！”

技术日记

17天前

在使用Mac电脑时，为了安全很多用户通常都会设置管理员密码。不过如果不小心忘记Mac管理员密码怎么办？幸运的是，有些方法可以重置Mac密码并重新获得访问权限。下面小编就教给大家几种重置用户密码的方法。未开启FileVaul

SQLSERVER操作问题及解决方案_sqlserver打开的文件与电脑文件中的内容不一致

编程

17天前

SQLSERVER入门，关于安装配置、数据备份、导入导出等常用操作及解决方法都在这里了一、数据库备份和附加1.SQL2008R2使用“数据库附加“的方法出现“只读”原因：将的mdf文件附加到

关于python打包py文件成exe文件_pycharm打包exe文件

编程

16天前

这里就只介绍常用的pyinstaller打包方法以及一些常遇到的问题目录一.打包步骤第一步：安装打包所依赖的包（pyinstaller）在cmd命令行中输入以下命令，然后回车进行安装 pi

CPU使用率100%怎么办_cpu占用率100%怎么解决

技术日记

16天前

CPU使用率100%的全面解决方案一、快速应急措施 1. 结束高占用进程 Windows系统：按 Ctrl+Shift+Esc打开任务管理器，按CPU使用率

pipwire cpu 100%使用率的问题

编程

16天前

在Manjaro使用6.14以下内核版本+pipwire1.4.1及以下版本（已知存在问题的版本）会出现因为声卡snd-seq模块导致的单核cpu使用率100%，导致笔记本耗电严重。通过lsof 看下5这个描述符是干啥的

MSI详解_msi全称

编程

15天前

原文： 1. 什么是MSI MSI全称Message Signaled Interrupt。当设备向一个特殊地址写入时，会向CPU产生一个中断，即也MSI中断。MSI能力最初在PCI 2.2里定

远程控制利器 TeamViewer 使用教程_timeviewer

技术日记

15天前

去年（2008年）12月份就关注过TeamViewer，感觉这款软件真的很不错，并且转载了一篇网络上的TeamViewer教程，不过现在看来原来那篇教程还有很多不足，所以现在推出最新的TeamViewer使用

【Tools】TeamViewer安装教程_teamviewer教程csdn

编程

15天前

00. 目录 01. TeamViewer简介 TeamViewer 是一个远程控制、桌面共享和文件传输的简单和快速的解决方案，它可以穿越工作在任何防火墙和NAT代理。要连接到另一台计算机，只需在两台计算机上运行Tea

使用Python在Word文档中插入和删除文本框_python-docx添加textbox

编程

15天前

在当今自动化办公需求日益增长的背景下，通过编程手段动态管理Word文档中的文本框元素已成为提升工作效率的关键技术路径。文本框作为文档排版中灵活的内容容器，既能承载多模态信息（如文字、图像），又可实现独立于正文流的位置调整与样式定制，但

如何在WPS打开的word、excel文件中，使用AI？_officeai.exe

编程

14天前

1、百度搜索： Office AI官方下载或者直接打开网址：打开后会直接提示开始下载中，下载完成后会让其选择下载存放位置：选择位置，然后命名文件，最后点击【保存】2、找到下载到电脑上的程

英雄联盟战斗力与隐藏分查询系统源码实战项目

技术日记

10天前

简介：本项目是一个针对《英雄联盟》（LOL）的游戏数据分析工具，涵盖战斗力评估、隐藏分查询、皮肤信息展示及自动化数据获取功能。通过API接口或网络爬虫技术，系统可获取玩家表现数据并进行深度分析，帮助玩家了解自身真实水平与匹配机制。源码

发表评论

全部评论 0

暂无评论

Linux大棚 – 不忘初心的技术博客，浮躁时代的安静角落

使用Python代码轻松捕获和保存HTML中的图像资源。

更多相关文章

掌握MuJoCo与MJX：物理仿真从理论到实践的可视化与数据交互指南

从代码到执行：ActivePerl助你免费编译Perl源码为高效程序

让Dell笔记本变安静，掌握粉丝控制技巧，告别烦人的噪音

如何在Linux中调整系统时间？超详细步骤解析

GTA5加速利器：YimMenu快速配置指南，十分钟内让游戏如丝般顺滑

告别软驱束缚，体验vFloppy v1.5的虚拟启动魅力

7月22日：网约车行业的新挑战：司机违规使用‘作弊器’

Ubuntu中启动不了Windows？看这篇教程修复双系统！

老毛桃装机教程实测：面对失败，如何寻找问题的关键点？

“Mac用户福音！忘记管理员密码？这里有快速解决方法！”

SQLSERVER操作问题及解决方案_sqlserver打开的文件与电脑文件中的内容不一致

关于python打包py文件成exe文件_pycharm打包exe文件

CPU使用率100%怎么办_cpu占用率100%怎么解决

pipwire cpu 100%使用率的问题

MSI详解_msi全称

远程控制利器 TeamViewer 使用教程_timeviewer

【Tools】TeamViewer安装教程_teamviewer教程csdn

使用Python在Word文档中插入和删除文本框_python-docx添加textbox

如何在WPS打开的word、excel文件中，使用AI？_officeai.exe

英雄联盟战斗力与隐藏分查询系统源码实战项目

发表评论

推荐文章

System Volume Information：安全防护的盲区

告别错误，启动无忧：让Word安全模式下的Adobe Flash Player流畅运行

电脑自动重启的原因几处理方法_电脑玩着玩着自动重启

电脑死机卡住怎么办 电脑卡住鼠标也点不动的解决方法_电脑突然卡住,鼠标和键盘都无反应

音乐歌词获取神器：一键网易云QQ音乐高品质LRC歌词

热门文章

SWF文件安全删除法：一招让文件彻底消失

DCMTK助力：一步到位的CDA文件至DICOM格式转换，含源代码

路由器隔一段时间就上不了网，断一下电又能用了，这是什么原因？_路由器隔断时间重连没网,没重连有网

Win2K标题栏字体变小问题

打开office word 2003 时出现了“出现问题需要关闭，是否发送错误报告”_office2003打开提示

基于springboot+vue多功能音乐播放系统

1.解决部分网页打不开的方法_via浏览器打不开网页怎么办

360助手精简安卓系统大法：轻松优化，让你的设备焕然一新

深度解析OpenHarmony5.0.2，USB摄像头如何无缝集成，提升用户体验

Deepin下的Ubuntu系统如何激活MW300UM无线USB网卡的网络功能？

最新文章

一文教会你AIX系统备份：mksysb实用指南

SWF文件备份失败？这些步骤让你轻松搞定

Win10系统备份轻松搞定：掌握captureimage命令的关键技巧

Linux系统安全小贴士：掌握备份与恢复，安心每一天

省时省心！三步完成电脑系统高效备份！

Ubuntu系统维护秘籍：备份步骤详解，保护你的劳动成果！

Linux系统不哭：高效备份与快速恢复方案

Ubuntu系统安全大计，备份技巧大公开

GHOST教程：系统备份和还原，小白也能变成高手！

Linux备份与恢复必修课：SWF文件安全策略从入门到精通

Exploring the Finest Accommodations: A Comprehensive Guide to Ruston LA Hotels

The Enchanting Experience of ScaliniTella NYC: A Culinary Gem in the Heart of Manhattan

Exploring the Exquisite Aloft Chicago O'Hare: A Blend of Modern Luxury and Convenience

A Culinary Journey: Discovering the Finest Dining Experiences in Waco, TX

A Culinary Journey: Discovering the Finest Dining Experiences in Athens, GA

电脑设备管理器在哪里？一次让我抓狂又兴奋的寻找经历

与GWX的持久战：一段关于Windows10升级弹窗的私人记忆

以管理员身份运行：那些年我们追过的权限与踩过的坑

电脑死机卡住怎么办电脑卡住鼠标也点不动的解决方法_电脑突然卡住,鼠标和键盘都无反应