admin 管理员组

文章数量: 1086019


2024年3月19日发(作者:排序算法不稳定的有哪些)

python数据提取方法

Python 具备多种数据提取的方法,下面列举几种:

1.通过API或者接口进行数据提取

有些网站或者服务都会提供接口供外部调用,这些接口提供的服务范围不定,

也不用具体的格式, python 可以通过HTTP、Json、Webservice 等方式调

用这些接口来提取数据,形成需要的使用数据。

2.抓取网页正文

有些网页是为了供人们阅读,里边就包含着网页正文,这些网页正文往往就是

我们需要的数据。python 用一些诸如 Beautifulsoup,scrapy 等抓取库就可

以从网页中抓取正文内容,并保存,方便使用。

3.爬取数据结构化数据

有些网站可以提供出结构化的数据,这时候,可以借助一些爬虫工具,爬取网

站上的数据,再通过程序处理成可用的数据。

4.爬取网页动态数据

有些网站是允许动态加载数据,比如使用Ajax技术动态加载数据,这种情况下,

需要模拟浏览器动态加载,我们可以使用selenium驱动浏览器抓取这些动态数

据。


本文标签: 数据 动态 网页 加载 提取