月5000円浮かせるpypdf2で作るpdf押印処理

さて、前回pypdf2でpdfを分割処理する方法をみていきました。

pypdf2はpdfの統合・編集などにおいて非常に便利なライブラリです。唯一の問題点はあまり更新が進んでいない点ですが、今の所動作的には大きな問題を抱えてはいないので、利用を中止するほどではないかと思っています。

月5000円浮かせるpypdf2で作るpdf分割処理

pythonのサードパーティライブラリpypdf2を利用して、pdfファイルの分割の仕方を解説していきます。RPAツールでできることの一部は実は簡単にライブラリを利用して実装できるケースとして紹介させていただきます。

また、元ネタとなった月5000円の機能にはPDFの分割だけではなく、ハンコ押印自動化機能も含まれていました。

今回はそれも試して行こうと思います。

利用する概念の紹介
シンプル verのコード
ざっとできた、ただこれだと問題点がある
指定の位置に押印するために必要な準備
まとめ

利用する概念の紹介

いわゆる、DegitalWaterMark/ウォーターマークと呼ばれる、日本語で言うところの透かしですね、機能を活用してハンコの押印をpythonでしていきます。

本来的にはWaterMarkは画像データ等の偽造防止用に使われる機能ですが、暗号化されたデータではなく単純なハンコデータをウォーターマーク処理することにより、ハンコを押したようにPDF上で見えるように処理していきます。

これは、pypdf2に含まれるmergePageメソッドを利用することで実現可能です。

シンプル verのコード

まずは、ウォーターマークの作成に慣れるために、簡単なパターンでコードをみていきます。

from PyPDF2 import PdfFileWriter, PdfFileReader

#input:押印対象ファイル, watermark:スタンプファイル
input = PdfFileReader(open("output/output-1.pdf", "rb"))
watermark = PdfFileReader(open("stampSample.pdf", "rb"))

#押印処理結果を保存するファイル（新規作成）
output = open("output/output-1-adjust.pdf", "wb")

#writerインスタンスを呼び出しておく
writer = PdfFileWriter()

#対象の１ページをinput/watermarkそれぞれで作成
input_firstpage= input.getPage(0)
watermark_firstpage = watermark.getPage(0)

#mergePageで統合する、統合した結果をwirterにaddpageする
input_firstpage.mergePage(watermark_firstpage)
writer.addPage(input_firstpage)

#writerにaddpageしたデータをベースに、output(新規作成ファイル）に書き込み
writer.write(output)

#最後にopenで開いている部分をclose処理する
output.close()

ざっとコード内に説明が入れてありますので、そちらをご確認ください。結果として、元の２ファイルから、どのようなファイルが出来上がるかを下に貼り付けます。

【input:押印対象ファイル output/output-1.pdf】