2022年 11月 4日

干货分享 | 如何用Python来操作PDF文件,建议收藏

大家好,我是俊欣,今天这篇文章,我们不谈热点,毕竟最近谈论的热点有点多了,也有点腻了,我们来讲一些Python运用实践当中的小技巧,用Python来操作和处理PDF文件,通过本篇文章,读者朋友大概会学会

1. 通过Python脚本来创建PDF文件

2. 加密或给PDF文件上锁

3. 将多份PDF文件合并起来

4. 给PDF文件上水印

好,那就由小编一个一个来给大家演示看

1

通过Python脚本来创建PDF文件

我们首先来创建一个PDF文件,在下面的代码当中我们是用“reportlab”的模块,要是该模块没有被安装的话,可以通过下面的命令行来进行安装

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple reportlab

然后创建PDF文件的代码,在文件当中输入“Hello World”内容,默认的输入是从左上角开始输入,

  1. from reportlab.pdfgen import canvas
  2. report = canvas.Canvas("file1.pdf")
  3. report.drawString(50, 800, "This is an example for Medium")
  4. report.save()

2

加密或给PDF文件上锁

有一些PDF文件当中有重要的内容,需要将其加密、上锁,我们可以通过以下的代码来实现,用到的密码是“hello”,结果会新生成一个加密过后的PDF文件叫做“new_encrypted.pdf”,代码如下

  1. from PyPDF2 import PdfFileReader, PdfFileWriter
  2. encrypted_file = PdfFileWriter()
  3. original = PdfFileReader("棉花.pdf")
  4. number_of_pages = original.numPages
  5. for i in range(number_of_pages):
  6. page = original.getPage(i)
  7. encrypted_file.addPage(page)
  8. password = "hello"
  9. encrypted_file.encrypt(password)
  10. with open("new_encrypted.pdf", "wb")as file:
  11. encrypted_file.write(file)

3

合并多份PDF文件

下面,我们将通过几行Python的代码来实现两个PDF文件的合并,我们用到了“PdfFileMerger()”方法,代码如下

  1. from PyPDF2 import PdfFileReader, PdfFileMerger
  2. first_file = PdfFileReader("棉花.pdf")
  3. second_file = PdfFileReader("30岁将就.pdf")
  4. output = PdfFileMerger()
  5. output.append(first_file)
  6. output.append(second_file)
  7. output.write("new_merged.pdf")

4

给PDF文件添加水印

有时候我们需要给PDF文件添加水印,原理是们手上有两个PDF文件,其中一个PDF文件是没有水印的,另外一个是有水印的,我们将这两个PDF文件合并,并且生成一个新的PDF文件

  1. from PyPDF2 import PdfFileReader,PdfFileWriter
  2. original_file = "file1.pdf"
  3. watermarked_pdf = "PDF_watermarked.pdf"
  4. output_file = "output.pdf"
  5. input_file = open(original_file, 'rb')
  6. input_pdf = PdfFileReader(input_file)
  7. watermark_file = open(watermarked_pdf, 'rb')
  8. watermark_pdf = PdfFileReader(watermark_file)
  9. watermark_page = watermark_pdf.getPage(0)
  10. pdf_page = input_pdf.getPage(0)
  11. pdf_page.mergePage(watermark_page)
  12. output = PdfFileWriter()
  13. output.addPage(pdf_page)
  14. output_file = open(output_file, 'wb')
  15. output.write(output_file)
  16. output_file.close()
  17. watermark_file.close()
  18. input_file.close()

一大波七夕表白文案来袭,“数据分析”助你脱单一臂之力

世界500强最新一轮排名出炉,最赚钱的行业竟然是它!?

数说“德尔塔”病毒,数据分析展示变异新冠毒株的传播情况

分享、收藏、点赞、在看安排一下?