您当前的位置：记灵知识库 > PDF工具 > Python3 编程中如何用 PyPDF2 快速拆分 PDF 文档？

Python3 编程中如何用 PyPDF2 快速拆分 PDF 文档？

2023年04月02日阅读量 1483

PyPDF2 是一个 Python 库，可用于处理 PDF 文件，其中包括拆分、合并、旋转和提取页面等操作。在本文中，我们将学习如何使用 PyPDF2 库来快速拆分 PDF 文档。

步骤

我们将按照以下步骤拆分 PDF 文档：

导入 PyPDF2 库
打开 PDF 文档
获取 PDF 文档页面数
按需求拆分文档
保存拆分后的 PDF 文档

导入 PyPDF2 库

首先，我们需要安装 PyPDF2 库。您可以使用以下命令来安装：

Copy code
pip install PyPDF2

完成安装后，我们可以导入库并使用它来拆分 PDF 文档：

pythonCopy code
import PyPDF2

打开 PDF 文档并获取页面数

在导入 PyPDF2 库后，我们需要打开要拆分的 PDF 文档。为此，我们使用 PyPDF2 的 PdfFileReader() 方法来打开 PDF 文件：

pythonCopy code
pdf_file = open('document.pdf', 'rb')
pdf_reader = PyPDF2.PdfFileReader(pdf_file)

其中，'document.pdf' 是要拆分的 PDF 文档的文件名。我们使用 'rb' 模式打开文件，以便我们可以以二进制格式读取文件。

一旦我们打开 PDF 文档，我们需要获取文档的页面数。我们可以使用 PyPDF2 的 numPages 属性来获取页面数：

pythonCopy code
page_count = pdf_reader.getNumPages()

现在我们有了文档的页面数，我们可以按需求拆分文档。

按需求拆分文档

我们可以使用 PyPDF2 的 PdfFileWriter() 方法创建一个新的 PDF 文件，该文件将包含我们要拆分的页面。然后，我们可以使用 addPage() 方法将每个页面添加到新的 PDF 文件中。

以下代码演示如何拆分前三个页面并将它们保存到一个新的 PDF 文件中：

pythonCopy code
pdf_writer = PyPDF2.PdfFileWriter()
# 拆分前三个页面
for page_number in range(0, 3):
    page = pdf_reader.getPage(page_number)
    pdf_writer.addPage(page)
# 创建新的 PDF 文件
output_file = open('split.pdf', 'wb')
# 将拆分后的页面保存到新的 PDF 文件中
pdf_writer.write(output_file)
# 关闭所有打开的文件对象
output_file.close()
pdf_file.close()

在上面的代码中，我们使用了 for 循环来迭代前三个页面，并使用 getPage() 方法获取每个页面。然后，我们将每个页面添加到新的 PDF 文件中，最后使用 write() 方法将新的 PDF 文件保存到磁盘上。

结论

通过使用 PyPDF2 库，我们可以轻松快速地拆分 PDF 文档。我们只需要使用 PdfFileReader() 方法打开 PDF 文件，然后使用 addPage() 方法将页面添加到新的 PDF

关键词： PDF拆分