はじめに
今回、PDFファイルにおいて、特定のページを抽出する機能と、分割する機能を作成しました。
抽出・分割するにあたり、PDFtkというPDFドキュメント操作ツールを使用しました。
PDFtkとは
コマンドラインからPDFを編集できるツールです。GUI版もあります。
コマンドラインで、特定のコマンドを実行すると、PDFファイルを編集することができます。
一部コマンドを紹介します。
今回使用した、 PDFtkのコマンド紹介
1.抽出
・PDF抽出コマンド [cat]
PDFファイルから特定のページを抽出するコマンドです。
cat実行前のPDFファイル
//input.pdfの2ページと3ページをoutput.pdfとして抽出します。
pdftk input.pdf cat 2-3 output output.pdf
cat実行後のPDFファイル
2.分割
・PDF分割コマンド [burst]
PDFファイルを分割するコマンドです。
//input.pdfを分割し、分割したファイルをoutput_XX.pdfとして複数枚出力します。
pdftk input.pdf burst output output_%02d.pdf
burst実行前のPDFファイル
burst実行後のPDFファイル
3.ページ数取得
・PDFファイルのページ数取得[dump_data]
input.pdfのページ数を取得するコマンドです。
//grepコマンドを併用してdump_dataのNumberOfPagesを取得してページ数を取得しています。
pdftk input.pdf dump_data | grep NumberOfPages
PDFtkを使用してのツール作成
今回、上記のPDFtkコマンドとphpを使用して、PDF抽出・分割ツールを作成しました。
PDFファイルを簡単に編集することができます。
分割選択時
抽出選択時
最後に
今回はPDFtkを使用した、PDFファイルの編集を行いました。
コマンドを入力することで、簡単にPDFファイルの編集を行うことができました。
また、今回使用したコマンド以外にも様々なコマンドがあるので、PDFの編集機能をさらに拡大できそうです。
ご覧いただきありがとうございました。