首页编程正文内容

python获取已打开的网页内容_用Python获取网页数据

编程

更新时间：2026-04-03 09:20:24 35

admin 管理员组

文章数量: 1184232

# -coding: utf-8

imoprt urllib2

import urllib

import re

# 填写需要采集的网址

urlPath = '

# 设置网页头部信息，模拟浏览器

headers = {'User-Agent' : agent, 'Accept' : '*/*', 'Referer' : 'http://www.google'}

# 打开网页，并读取网页源码

request = urllib2.Request(urlPath, headers=headers)

response = urllib2.urlopen(request)

html = response.read()

# 构建图片标签正则表达式

img=repile(r"""""",re.I)

# 保存的图片名称和路径，需要自己设置

path = '~/Code/Python/img_splider/'

try:

# 使用正则匹配出所有的img标签

img_list = re.findAll(img, html)

# 遍历得到的所有标签，然后进行下载

for i in xrange(length(img_list)):

# 使用urllib读取打开图片

data = urllib.urlopen(img_list[i]).read()

# 保存图片的格式为jpeg，需要自己看

imgStr = path + str(i) + '.jpeg'

# 打印出图片的url

print imgStr

# 创建文件

f = file(imgStr, 'wb')

# 写入图片

f.write(data)

# 关闭文件流

f.close()

except Exception, e:

print 'error'

以前写了很多关于爬虫的文章，在博客上面，www.scienceswork，可以参考一下。一起学习，上面的代码可以先试下，不行的话在调试

本文标签：网页内容数据 python

版权声明：本文标题：python获取已打开的网页内容_用Python获取网页数据内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.roclinux.cn/b/1768022674a3527009.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

一文读懂：深入剖析bin、hex及axf格式，揭秘它们在嵌入式开发领域的奥秘

技术日记

1月前

嵌入式开发必懂：bin、hex、axf格式的核心区别与应用场景你有没有想过，当你把程序下载到单片机时，那些后缀名不同的文件（.bin、.hex、.axf）到底藏着什么秘密？为什么同样的代码会生成不同格式的文件？今天就来扒开这

Hex和Bin的奇妙旅程：实用转换技巧分享

技术日记

1月前

大家好，我是学电子的小白白。熟悉单片机开发的朋友，应该经常见到*.hex后缀的文件，它是单片机和嵌入式工程编译输出的一种常见的目标文件格式（比如keil就能编译输出hex文件），通过烧写工具把它下载到单片机中，程序就能在芯片

鼠中键妙用大解析与快速修复指南，提升办公效率

技术日记

1月前

最近的鼠标中键突然灵敏度大大降低, 需要重重的按下去才会有反应; 今天上午联系淘宝客服, 客服说可以以换代修, 不过要自己出运费, 一看到要钱, 立马就还是想着自己修一修算了. 之前的鼠标中键也很容易坏(不过都是9.9包邮级别的, 几

一学就会：DMP转储文件的简易操作指南

编程

1月前

简介 dmp文件（dump文件）：系统错误内存转储文件，可以把转储文件看成软件的某个时刻的一个快照。系统发生错误时转储的内存镜像，记录有发生系统错误的详细信息。 windows 10系统默认的

深入浅出：了解Python中temp变量在代码逻辑中的角色

编程

1月前

在Python中，temp是一个常见的命名约定，通常用于表示临时变量或临时存储数据的变量。"temp"一词是"temporary"的缩写，意味着它只是用于暂时存储数据，而不是长期使用。在编程

Mysql高可用集群配置秘籍：一主两从模式实战演练

技术日记

1月前

一、项目概述成功部署并验证了MySQL 8.3.0一主两从复制集群，实现了数据自动同步、高可用性和读写分离基础架构。该项目涵盖了从环境准备、软件安装、配置优化到故障排查的全流程。 MySQL 集群（MySQL C

困在CSDN的360浏览器用户必看：一招直达网页！

技术日记

1月前

从百度或者csdn的搜索中打开，会发现打不开网页，以前也出现过，只是以为这篇文章被删了，昨天接连多个文章打不开，怀疑的浏览器的问题，复制网址到edge浏览器就打开了刚刚又出现了，怀疑360会拦截某些内容 edge浏览

VSCode秘藏技能：一键复制当前代码，高效编辑，流畅如流水！

编程

29天前

VSCode里面有很多快捷键，接下来我讲一些我认为最实用的，可以帮助萌新提高代码编写速度 1.快捷复制粘贴 · 会改变剪切板的复制 ctrl+c光标定在那一行想复制的地方，直接Ct

提升电脑性能：通过删除pagefile.sys和hiberfil.sys释放C盘空间

编程

29天前

通过移除 pagefile.sys 和 hiberfil.sys 文件释放C盘空间（不推荐）点击查看 -> 选项 -> 文件夹选项 -> 查看，取消勾选 “ 隐藏受保护的操作系统文件(推荐)” ，选择“显示

012-XMP数据处理：打造Adobe Flash Player内核的XMP架构

编程

25天前

012-XMP数据处理学习目标通过本章学习，你将掌握：XMP标准理解 XMP元数据架构和结构 XMP命名空间和属性定义 XMP与其他元数据

ASF文件格式入门：让Flash内容制作更加高效与流畅

编程

22天前

了解ASF文件格式对于开发人员在处理多媒体文件时非常重要。ASF代表"Advanced Systems Format"，是一种由Microsoft开发的多媒体容器格式，用于存储和传输音频和视频数据。在本指南中，我们将深入

在32位与64位之间：操作系统的内存与处理器挑战

编程

19天前

64位系统和32位系统的区别:操作系统只是硬件和应用软件中间的一个平台 32位操作系统针对的32位的CPU设计 64位操作系统针对的64位的CPU设计我们的CPU从原来的8位，16位，

从基础到进阶：VLOOKUP在Excel中的运用与优化策略

技术日记

18天前

说明我下面简单说明匹配数据，详细使用方式也可以参考下面文库哈EXCEL表中如何利用VLOOKUP将2张工作表的数据匹配？ countif 方式1 A列数据在B列中出现的次

Canon CR2图片的神秘IFD0：揭示RAW格式的隐藏细节

技术日记

18天前

首先是8个字节的文件头。 CR2的前2个字节是"II"，代表INTEL格式的存储顺序，即低字节在前，高字节在后。接下来是固定的2个字节：0x2a00。最后的4个字节的整数是指向第一个IFD（I

即时更新：厂里Flash中心的最热文章，深度剖析Adobe Flash Player的前沿技术

编程

18天前

1 今日内容 1.1 定时计算与实时计算 1.2 今日内容 kafkaStream 什么是流式计算 kafkaStream概述 kafkaStream入门案例

硬盘坏了，数据要凉凉了吗？——硬盘坏道数据恢复，找回丢失数据的希望！

技术日记

18天前

电脑硬盘坏了数据可以恢复吗？对于这种问题，还需要具体问题具体分析的，一般是可以恢复。硬盘损坏可以分为物理损坏和逻辑损坏两种情况： 1.逻辑损坏这通常是由于软件问题，如文件系统错误、病毒攻击、误删除、格式化等

深度解读硬盘性能排行榜，助你选购顶级硬盘！

编程

18天前

硬盘天梯排行榜数据集成指南引言硬盘天梯排行榜数据为开发者和企业提供了硬盘性能的权威参考，涵盖SSD、HDD等各类存储设备的读写速度、耐用性、性价比等关键指标。通过API集成这些数据，用户可以快速获取最新的硬盘排名信

掌握SWF文件，驾驭Adobe Flash Player的无限可能

编程

17天前

一、Application Data简介Applicaion Data相当于桌面应用的注册表，存储一些用户配置信息，如运行时状态，用户喜好等，需要注意的时，当卸载应用时，这些数据会被删除，所以不要存储重要数

Adobe Flash Player与SWF：一段从技术到应用的旅程

技术日记

17天前

一、Application Data简介Applicaion Data相当于桌面应用的注册表，存储一些用户配置信息，如运行时状态，用户喜好等，需要注意的时，当卸载应用时，这些数据会被删除，所以不要存储重要数

Go与Linux通信基础：strace与read操作的深入解读

技术日记

17天前

大家好，我是码农先森。前言各种编程语言百花齐放、百家争鸣，但是 “万变不离其中”。对于网络通信而言，每一种编程语言的实现方式都不一样；但其实，调用的底层逻辑都是一样的。linux 系统底层向上提供了统一的 Sock

发表评论

全部评论 0

暂无评论

推荐文章

Windows系统大救援：应对无权限、拒绝访问的System Volume Information挑战

路由器接口全解析

污水厂干粉配制加药设备远程监控系统方案

DWG格式的文件如何快速打开？_dwg文件怎么打开

对Autorun.inf类病毒(U盘病毒)的攻防经验总结

热门文章

最新文章