admin 管理员组

文章数量: 1086019


2024年3月10日发(作者:法国与墨西哥)

Python网络爬虫程序技术 (微课版) 教案

项目1 爬取外汇网站数据

课时内容

Web网站与访问

授课时间

90分钟

课时

讲授4

实践4

教学目标

教学重点

学习编写一个爬虫程序,通过正则表达式匹配的方法爬取模拟外汇网站的汇率数据。

教学难点

认识爬虫程序,搭建爬虫程序开发环境。

认识Flask并使用Flask创建Web网站。

学习使用GET方法访问网页。

学习使用POST方法访问网页。

掌握正则表达式选取数据的规则。

教学设计

1. 教学思路:(1)通过讲解Flask、GET方法、POST方法等相关知识,让学生了解爬虫程序的概况;

(2)讲解制作模拟外汇网站的爬取,让学生掌握上述知识点的基本操作;(3)安排练习爬取实际外

汇网站,巩固学生掌握的技能。

2. 教学手段:(1)通过讲解基础知识,讲解结束后开始实践并进行疑难解答;(2)通过实战项目,

让学生掌握爬虫程序在实际工作中的相关应用。

3. 教学要求:可对实际外汇网站进行爬取,让学生了解爬虫爬取外汇网站应该掌握的技能。

教学内容

1.1 外汇网站项目任务

1.2.1理解爬虫程序

1.2.2搭建开发环境

1.3.1 安装Flask框架

1.3.2创建模拟外汇网站

1.3.3获取网站HTML代码

第 1 页

1.4.1客户端GET方式发送数据

1.4.2服务器获取GET发送的数据

1.5.1客户端POST发送数据

1.5.2服务器获取POST的数据

1.5.3 混合使用GET与POST

1.6.1 使用正则表达式匹配字符串

1.6.2 使用正则表达式爬取数据

1.7 综合项目——爬取模拟外汇网站数据

1.7.1 创建模拟外汇网站

1.7.2 解析网站HTML代码

1.7.3 设计存储数据库

1.7.4 编写爬虫程序

1.7.5 执行爬虫程序

1.8 实战项目——爬取实际外汇网站数据

1.8.1 解析网页HTML代码

1.8.2 爬取网页外汇数据

1.8.3 设计存储数据库

1.8.4 编写爬虫程序

1.8.5 执行爬虫程序

小结

掌握了使用正则表达式对网站的网页进行解析,得到所需数据,实现了爬取网站外汇汇率数据的爬虫

程序。

课程安排

课程实践环境

Python3.6 + vsCode IDE

教材及参考书

教材 《Python爬虫项目教程》(微课版),黄锐军编,人民邮电出版社,2021年

参考书 《数据采集技术-Python网络爬虫项目化教程》,黄锐军编,高等教育出版社,2018年

第 2 页


本文标签: 网站 爬虫 爬取 外汇 数据