首页技术日记正文内容

Python 操作PDF的几种方法

技术日记

更新时间：2026-04-03 11:41:02 88

admin 管理员组

文章数量: 1184232

2024年12月29日发(作者：判断模板参数是否为智能指针)

Python 操作PDF的几种方法

前言

本文主要涉及：

os 模块综合应用

glob 模块综合应用

PyPDF2 模块操作

基本操作

PyPDF2 导入模块的代码常常是：

这里导入了两个方法：

PdfFileReader 可以理解为读取器

PdfFileWriter可以理解为写入器

接下来通过几个案例进一步认识这两个工具的奇妙之处，用到的示

例文件是5个发票的pdf

每个发票的PDF都由两页组成：

合并

第一个工作是将5个发票pdf合并成10页。这里读取器和写入器应

该怎么配合呢？

逻辑如下：

读取器将所有pdf读取一遍

读取器将读取的内容交给写入器

写入器统一输出到一个新pdf

这里还有一个重要的知识点：读取器只能将读取的内容一页一页交

给写入器。

因此，逻辑中第1步和第2步实际上不是彼此独立的步骤，而是读

取器读取完一个pdf后，就将这个pdf全部页循环一遍，挨页交给

写入器。最后等读取工作全部结束后再输出。

看一下代码可以让思路更清楚：

由于全部内容都需要交给同一个写入器最后一起输出，所以写入器

的初始化一定是在循环体之外的.

如果在循环体内则会变成每次访问读取一个pdf就生成一个新的写

入器，这样每一个读取器交给写入器的内容就会被反复覆盖，无法

实现我们的合并需求!

循环体开头的代码：

目的就是每次循环读取一个新的pdf文件交给读取器进行后续操

作。实际上这种写法不是很提倡，由于各pdf命名恰好很规则，所

以可以直接人为指定数字进行循环。更好的方法是用 glob 模块：

代码中 pdf_Pages(): 能够获取读取器的页数，配合

range就能遍历读取器的所有页。

pdf_e(pdf_e(page))能够将当前页交

给写入器。

最后，用with新建一个pdf并由写入器的 pdf_(out)

方法输出即可

拆分

如果明白了合并操作中读取器和写入器的配合，那么拆分就很好理

解了，这里我们以拆分为2个单独的pdf文档为例，同样

也先来捋一捋逻辑：

读取器读取PDF文档

读取器一页一页交给写入器

写入器每获取一页就立即输出

通过这个代码逻辑我们也可以明白，写入器初始化和输出的位置一

定都在读取PDF循环每一页的循环体内，而不是在循环体外

代码很简单：

水印

本次的工作是将下图作为水印添加到中

首先是准备工作，将需要作为水印的图片插入word中调整合适位置

后保存为PDF文件。然后就可以码代码了，需要额外用到copy模

块，具体解释见下图：

就是把读取器和写入器初始化，并且把水印PDF页先读取好备用,核

心代码稍微比较难理解：

加水印本质上就是把水印PDF页和需要加水印的每一页都合并一遍

由于需要加水印的PDF可能有很多页，而水印PDF只有一页，因此

如果直接把水印PDF拿来合并，可以抽象理解成加完第一页，水印

PDF页就没有了。

因此不能直接拿来合并，而要把水印PDF页不断copy出来成新的一

页备用new_page，再运用.mergePage方法完成跟每一页合并，把合

并后的页交给写入器待最后统一输出!

关于.mergePage的使用：出现在下面的页.mergePage(出现在上面

的页)，最后效果如图：

加密

加密很简单，只需要记住：「加密是针对写入器加密」

因此只需要在相关操作完成后调用pdf_t(密码)

以单个PDF的加密为例：

当然除了对PDF的合并、拆分、加密、水印，我们还可以使用

Python结合Excel和Word实现更多的自动化需求，这些就留给读

者自己开发。

本文标签：读取器读取写入需要

版权声明：本文标题：Python 操作PDF的几种方法内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.roclinux.cn/p/1735558386a1676934.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

linux下安装jdk,tomcat,mysql

技术日记

2024-12-26

年月日发(作者：系统安装字体)下安装对于安装,需要进行以下几个步骤:·、从公司网站下载的安装版本·、通过将该文件上传到·、修改该文件的运行权限·、查询安装文件是什么类型的文件，如果是.的文件表示为可以直接运行的文件，如果是文件表示需要通过来

安装麒麟操作系统的常见问题及应对方法

技术日记

2024-12-26

年月日发(作者：解压)【安装麒麟操作系统的常见问题及应对方法】一、前言安装操作系统是使用电脑的第一步，而麒麟操作系统作为国产操作系统备受关注。然而，安装过程中常常会遇到各种各样的问题，今天我们就来探讨一下常见的安装问题及应对方法。二、安装过

如何设置电脑上的系统时间和日期

技术日记

2024-12-26

年月日发(作者：语句基本格式)如何设置电脑上的系统时间和日期作为现代化的计算设备，电脑不仅仅是工作学习的工具，同时也承担着时间和日期的显示和管理功能。正确设置电脑上的系统时间和日期对于我们的日常使用和一些特殊需求都是非常关键的。本文将为您详

易语言读取自身内存数据的方法

技术日记

2024-12-27

年月日发(作者：经典汉诺塔下载)易语言读取自身内存数据的方法易语言是一种非常简单易学的编程语言，广泛应用于软件开发领域。它的语法简单明了，许多开发者可以轻松上手，而且易语言还具备许多强大的功能，包括读取自身内存数据。在本文中，我将为大家逐步

c++注册回调函数

技术日记

2024-12-28

年月日发(作者：衣服)注册回调函数中注册回调函数可以使用函数指针或表达式两种形式来实现。使用函数指针注册回调函数的步骤如下：.定义回调函数指针类型(*)(,);.定义需要注册回调函数的类{:();();:_;};.在类的实现中实现回调函数的

瓷砖胶的标准等级

技术日记

2024-12-28

年月日发(作者：查看使用的配置文件)瓷砖胶的标准等级,,.,..瓷砖胶，又称水泥砂浆，是瓷砖安装中的重要材料。它作为瓷砖与基层之间的粘合剂，确保了坚固持久的粘合。瓷砖胶的标准等级在决定瓷砖安装质量和寿命方面起着至关重要的作用。,,..,.瓷

区块链技术通俗讲解

技术日记

2024-12-28

年月日发(作者：微交互和微动效网页界面设计)区块链技术通俗讲解区块链是目前较为热门的互联网技术之一，也被认为是未来的方向之一。那么，什么是区块链呢？简单来说，它是一种由多个节点组成的分布式数据库，每个节点都能够记录和存储数据，并与其他节点之

bindtolifecycle 用法

技术日记

2024-12-30

年月日发(作者：语法)用法在开发中，我们经常需要处理与生命周期相关的任务，比如当一个或销毁时，我们可能需要取消网络请求、停止定时器、释放资源等。为了更好地管理和控制这些任务，提供了一个名为的库，它可以让我们轻松地绑定任务到生命周期的特定阶段

Endrich NBIoT M910-GL 三模LPWA模块说明书

技术日记

2024-12-30

年月日发(作者：软件开发需要学什么)!•-:--••••:-•!-–-.--(.,)-.-,-,,(.).(...)..,,.,,,,,,....,::(.):..(.)-%•••••--•••••()(),,,.,..--........

幼儿园托班科学教案:糖的制作和工艺

技术日记

2025-1-1

年月日发(作者：微信小程序搭建服务器)幼儿园托班科学教案：糖的制作和工艺。一、糖的概述糖是生活中常见的食品之一，也是我们日常生活中必不可少的食品之一。糖分为白糖、红糖、黄糖等多种，但其基本成分都是蔗糖。糖有多种制作方法，包括农户自行加工、工

粉剂的基本组成

技术日记

2025-1-1

年月日发(作者：码转换为进制)粉剂的基本组成一、什么是粉剂粉剂是一种固体药物剂型，由细粉状的药物和辅料组成。它是将药物通过粉碎、筛分等工艺处理后制成的，具有良好的溶解性和吸收性。二、粉剂的基本组成粉剂的基本组成包括以下几个方面：.药物成分药

程序设计的基本流程四步

技术日记

2025-1-1

年月日发(作者：什么意思)程序设计的基本流程四步下载温馨提示:该文档是我店铺精心编制而成，希望大家下载以后，能够帮助大家解决实际的问题。文档下载后可定制随意修改，请根据实际需要进行相应的调整和使用，谢谢!并且，本店铺为大家提供各种各样类型的

程序设计基础知识(简答题)

技术日记

2025-1-2

年月日发(作者：浏览软件)程序设计基础知识(简答题)程序设计基础知识计算机科学与技术的发展让我们深刻认识到程序设计的重要性。程序设计是计算机科学的核心和基础，是实现计算机应用的关键。本文将从简答题的角度探讨程序设计基础知识。一、什么是程序设

程序设计基本步骤

技术日记

2025-1-2

年月日发(作者：码怎么编码)程序设计基本步骤程序设计是软件开发过程中的核心环节，它涉及到将问题转化为计算机能够理解和执行的代码。程序设计的基本步骤是通用的，无论是使用哪种编程语言，都遵循相似的流程。以下是程序设计的基本步骤：.问题定义：首先

Java开发者进阶之路：深入探讨在二级综合应用中利用Adobe Flash Player进行点击操作的技巧

编程

1月前

目录3.43 import java.io.*;import java.awt.*;import java.awt.event.* ;**********found**********importjav

从入门到精通：全面解析如何操作和读取DBF文件技巧指南。

技术日记

1月前

有个需求，在c#前端读取dbf中的数据。网上搜索到的大部分都是配置ODBC方式的连接去读取的，还得安装驱动。因为最终客户端不能要求每个客户都去安装foxpro驱动，故此此处实现直接用代码去读取dbf数据。 using System;

C#开发中遇到的DBF读取挑战及应对策略

编程

1月前

C#读取dbf文件网上有很多例子，大致代码都如下： private void btnCreate_Click(object sender, EventArgs e){try

从错误中学习：C#读取dbf文件的异常处理技巧

编程

1月前

C#读取dbf文件网上有很多例子，大致代码都如下： private void btnCreate_Click(object sender, EventArgs e){try

构建嵌入式系统的坚固防线：通过POST检测、状态机配置和超时保护

技术日记

1月前

1. 嵌入式系统可靠性工程：从“功能实现”到“工业级稳定”的三道生死线在嵌入式产品交付现场，最常听到的一句反问是：“代码功能都跑通了，为什么用户一用就死机？”更刺耳的是测试工程师的反馈：“实验室连续运行72小时无异常，发往客

h264文件视频存储格式和音频存储格式_h264 音频

编程

10天前

mp4封装目录h264视频流格式介绍aac音频流格式介绍h264视频文件读取通过帧索引解析h264文件通过解析h264结构读取文件aac音频文件读取

发表评论

全部评论 0

暂无评论

Linux大棚 – 不忘初心的技术博客，浮躁时代的安静角落

Python 操作PDF的几种方法

更多相关文章

linux下安装jdk,tomcat,mysql

安装麒麟操作系统的常见问题及应对方法

如何设置电脑上的系统时间和日期

易语言读取自身内存数据的方法

c++注册回调函数

瓷砖胶的标准等级

区块链技术通俗讲解

bindtolifecycle 用法

Endrich NBIoT M910-GL 三模LPWA模块说明书

幼儿园托班科学教案:糖的制作和工艺

粉剂的基本组成

程序设计的基本流程四步

程序设计基础知识(简答题)

程序设计基本步骤

Java开发者进阶之路：深入探讨在二级综合应用中利用Adobe Flash Player进行点击操作的技巧

从入门到精通：全面解析如何操作和读取DBF文件技巧指南。

C#开发中遇到的DBF读取挑战及应对策略

从错误中学习：C#读取dbf文件的异常处理技巧

构建嵌入式系统的坚固防线：通过POST检测、状态机配置和超时保护

h264文件视频存储格式和音频存储格式_h264 音频

发表评论

推荐文章

轻松搞定Win10开机慢，四叶草转法教你实战操作

AI驱动：高效生成KMS激活脚本的全面教程

CPU 使用率和负载Load_cpu load

计算机十二种常用密码破解法（非常详细），零基础入门到精通，看这一篇就够了_电脑某个软件的密码怎么找

如何查看电脑刷新率_怎么看显卡支持的刷新率

热门文章

从零开始：实战教程，SWF帮你自动抓取新闻

Windows 11上VMware的安装攻略

Google地图切片URL解析攻略：从菜鸟到高手的进阶之路

路由器门前的抉择：数据包的入站接口两面世界

Docker默认网段撞上主机，访问失败？解决方案在这里！

使用编程设置默认主页的IE浏览器_助力程序员编程提效,已经设置为浏览器默认打开页

Deepin【2】：Deepin系统盘扩容

一步到位：如何让电脑音效在耳机和音响中同步

Nod32密码不再成谜：破解技巧大放送

自动解压秘籍：Python帮你搞定各种压缩文件

最新文章

一文教会你AIX系统备份：mksysb实用指南

SWF文件备份失败？这些步骤让你轻松搞定

Win10系统备份轻松搞定：掌握captureimage命令的关键技巧

Linux系统安全小贴士：掌握备份与恢复，安心每一天

省时省心！三步完成电脑系统高效备份！

Ubuntu系统维护秘籍：备份步骤详解，保护你的劳动成果！

Linux系统不哭：高效备份与快速恢复方案

Ubuntu系统安全大计，备份技巧大公开

GHOST教程：系统备份和还原，小白也能变成高手！

Linux备份与恢复必修课：SWF文件安全策略从入门到精通

Exploring the Finest Accommodations: A Comprehensive Guide to Ruston LA Hotels

The Enchanting Experience of ScaliniTella NYC: A Culinary Gem in the Heart of Manhattan

Exploring the Exquisite Aloft Chicago O'Hare: A Blend of Modern Luxury and Convenience

A Culinary Journey: Discovering the Finest Dining Experiences in Waco, TX

A Culinary Journey: Discovering the Finest Dining Experiences in Athens, GA

电脑设备管理器在哪里？一次让我抓狂又兴奋的寻找经历

与GWX的持久战：一段关于Windows10升级弹窗的私人记忆

以管理员身份运行：那些年我们追过的权限与踩过的坑