首页编程正文内容

python爬虫爬取腾讯新闻

编程

更新时间：2026-04-03 16:05:13 122

admin 管理员组

文章数量: 1184232

python爬虫爬取腾讯新闻

话不多说，直接上代码！

import requests
from bs4 import BeautifulSoup

def getHTMLText(url):
    try:
        r = requests.get(url, timeout = 30)
        r.raise_for_status()
        #r.encoding = 'utf-8'
        return r.text
    except:
        return ""

def getContent(url):
    html = getHTMLText(url)
    # print(html)
    soup = BeautifulSoup(html, "html.parser")
    title = soup.select("div.hd > h1")
    print(title[0].get_text())
    time = soup.select("div.a_Info > span.a_time")
    print(time[0].string)
    author = soup.select("div.qq_articleFt > div.qq_toolWrap > div.qq_editor")
    print(author[0].get_text())
    paras = soup.select("div.Cnt-Main-Article-QQ > p.text")
    for para in paras:
        if len(para) > 0:
            print(para.get_text())
            print()
    fo = open("text.txt", "w+")
    fo.writelines(title[0].get_text() + "\n")
    fo.writelines(time[0].get_text() + "\n")
    for para in paras:
        if len(para) > 0:
            fo.writelines(para.get_text() + "\n\n")
    fo.writelines(author[0].get_text() + '\n')
    fo.close()
    article = {
        'Title' : title[0].get_text(),
        'Time' : time[0].get_text(),
        'Paragraph' : paras,
        'Author' : author[0].get_text()
    }
    print(article)
    
def main():
    url = "http://news.qq/a/20170504/012032.htm"
    getContent(url);
main()

运行结果：

本文标签：爬虫腾讯新闻 python

版权声明：本文标题：python爬虫爬取腾讯新闻内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.roclinux.cn/b/1755008361a3059773.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

掌握Python任务调度：使用Python-Schedule库

编程

3月前

本文还有配套的精品资源，点击获取简介：Python Schedule是一个简单易用的Python任务调度库，允许开发者设置定时任务执行Python函数或可调用对象。其

python的schedule模块

编程

3月前

这里写自定义目录标题一，schedule模块1.什么是schedule模块2.具体应用二，详细源码一，schedule模块 1.什么是schedule模块 schedul

Python Schedule定时任务

编程

3月前

# 参考 https:zhuanlan.zhihup23086148# pip install scheduleimport scheduleimport timedef job(name):print("her na

镜像网站 linux 程序,腾讯开源镜像网站（腾讯云软件源）地址，附使用说明

编程

3月前

腾讯开源镜像网站(腾讯云软件源Tencent Open Source Mirror Site)正式上线了，以下为相关介绍及使用说明。腾讯开源镜像网站介绍腾讯云软件源由腾讯云提供支持。搭建此开源镜像的目的在于宣传自由软

腾讯+微信创造属于你自己的AI智能体

编程

3月前

先看看效果： 首先进入腾讯元宝官网： 腾讯元器 1、点击创建智能体然后命名 2、创建类型可以选，我这里选择的是公众号的 3、因为我这里是选择公众号的需要授权公众号、添加信息

Windows 10 安装UHD驱动, 用UHD python API使用USRP B210

编程

3月前

本文基于这样的需求：想在Windows (10) 下，用UHD Python API 使用Ettus USRP B210，官方文档介绍的是基于从源码安装，这种方式对我来说太浪费时间，网上有很多教程，但由于需求不同，很多是我不需要的，比如说安

关于 python 字典报错 dictionary changed size during iteration 的理解

编程

3月前

有时在 python 中对字典进行遍历或迭代过程中，会提示错误 dictionary changed size during iteration，这说明你对遍历或迭代的条件设置一定是错误的&

腾讯视频无法连接网络？全面排查与解决方案指南

编程

2月前

腾讯视频无法连接网络？全面排查与解决方案指南在数字化娱乐时代，腾讯视频作为国内主流的在线视频平台，承载着海量用户的观影需求。然而，当用户遇到「无法连接网络」的提示时，不仅会打断观影体验，还可能因技术门槛导致排查困难。本文将结合系统原理与

python接管已经打开的浏览器_Python Webdriver 重新使用已经打开的浏览器实例

编程

2月前

因为Webdriver每次实例化都会新开一个全新的浏览器会话，在有些情况下需要复用之前打开未关闭的会话。比如爬虫，希望结束脚本时，让浏览器处于空闲状态。当脚本重新运行时&am

【python】Windows,python3.11.4安装

编程

2月前

一、下载python1、进入官网 ，python的官方网站https:www.python2、点击下载按钮（Downloads）进入下载页面3、点击Download p

Python爬虫必备！Scrapy框架快速入门：从0到1爬取数据，新手也能秒上手（附实战案例）

编程

2月前

作为一个从“requests+BeautifulSoup手写爬虫”到“Scrapy框架重度使用者”的过来人，太懂新手学爬虫的痛点了：用原生库写爬虫，要自己处理请求头、反爬、数据存储、并发请求，爬个简单的豆瓣榜单都要写几百行代码；遇到网站反爬

腾讯云安装halo博客

编程

2月前

腾讯云安装halo博客如果网站已经配置好可以直接使用的，可以直接跳转到《6》进行1panel的安装， 如果跳过之后安装出现问题，可以看看前面步骤从《6》开始的安装视频

python jupyter notebook下载_Jupyter notebook 安装

编程

2月前

这里将告诉您Jupyter notebook 安装,具体完成步骤:一、建议从官网下载最新版anacondahttps:www.anaconda进入网址找到下载位置，并找到对应的版本，下载py

在win10系统中安装多个不同版本的python环境

编程

2月前

20211112补充今天按照下面的方法使用时，不知道什么原因，始终不能使用较低的python新建虚拟环境。后来在仔细查阅pipenv的文档，发现在新建虚拟环境时&am

一分钟学会,Python 打开网页的几种方式

编程

2月前

Python是一门功能强大的编程语言,能够执行各种任务,其中包括自动化地打开网页.无论你是想用 Python 脚本自动打开浏览器,还是想在代码中获取网页内容,这篇文章将详细介绍几种常用的方法.1. 使用 webbrowser 模块打开网页描

python 与 webdriver结合打开不同浏览器

编程

2月前

Firefox Chrome Chrome需要安装驱动：下载驱动：http:chromedriver.storage.googleapisindex.html安装 chrome

如何实现python关闭浏览器？

编程

2月前

import os, sys# linux系统if "win" not in sys.platform:browserName"chrome"cmd"pkill{}"

python用浏览器打开网页的两种方式

编程

2月前

import osimport webbrowseros.system("C:Program FilesInternet Exploreriexplore.exe" http:www.baidu)webbrow

2020最新腾讯短网址生成api接口推荐

编程

2月前

腾讯短网址（url）就是使用腾讯的API接口将冗长的链接转换成超短的url链接。使用url短网址更易于用户记忆，利于用户转化。url短链接最开始是为了对抗http:t推出

【python爬虫实战】—— Selenium 接管已经打开的浏览器（附案例代码）

编程

2月前

在自动化测试领域，Selenium 无疑是王者般的存在。然而，传统的 Selenium 脚本通常需要从头启动浏览器，这在实际应用中可能会带来一些不便。例如&#xff0

发表评论

全部评论 0

暂无评论

推荐文章

V2M，V2MP3？Vob到MP3的简单转换秘籍！

qt如何在vista和windows7下实现Aero效果_qt实现类似apollo dreamview的效果

公共 IP 地址和私有 IP 地址的区别总结_公用ip地址

【2025终极指南】电脑怎么连接打印机：从USB有线、WiFi无线到共享打印机的全方位教程_打印机连接

您可能是盗版软件的受害者——解决办法_prallels desktop提示不是正版

热门文章

最新文章