admin 管理员组文章数量: 1184232
这个是个比较简单的例子,
网页中的图片地址都是使用'http://。。。。.jpg'这种方式直接定义的
使用前,可以先建立好一个文件夹用于保存图片,本例子中
使用的文件夹是 d:\\pythonPath这个文件夹
代码如下:
# -*- coding: UTF-8 -*-
import os,re,urllib,uuid
#首先定义云端的网页,以及本地保存的文件夹地址
urlPath='
localPath='d:\\pythonPath'
#从一个网页url中获取图片的地址,保存在
#一个list中返回
def getUrlList(urlParam):
urlStream=urllib.urlopen(urlParam)
htmlString=urlStream.read()
if( len(htmlString)!=0 ):
patternString=r'
searchPattern=re.compile(patternString)
imgUrlList=searchPattern.findall(htmlString)
return imgUrlList
#生成一个文件名字符串
def generateFileName():
return str(uuid.uuid1())
#根据文件名创建文件
def createFileWithFileName(localPathParam,fileName):
totalPath=localPathParam+'\\'+fileName
if not os.path.exists(totalPath):
file=open(totalPath,'a+')
file.close()
return totalPath
#根据图片的地址,下载图片并保存在本地
def getAndSaveImg(imgUrl):
if( len(imgUrl)版权声明:本文标题:掌握这招,用Python实现自动抓取网页中的SWF与Flash中心元素! 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/b/1770850123a3538278.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论