からくりブログ

株式会社からくり社員のブログです

PDFtkを使用してPDFファイルの分割・抽出してみた

はじめに

今回、PDFファイルにおいて、特定のページを抽出する機能と、分割する機能を作成しました。
抽出・分割するにあたり、PDFtkというPDFドキュメント操作ツールを使用しました。

PDFtkとは

コマンドラインからPDFを編集できるツールです。GUI版もあります。
コマンドラインで、特定のコマンドを実行すると、PDFファイルを編集することができます。
一部コマンドを紹介します。

今回使用した、 PDFtkのコマンド紹介

1.抽出

・PDF抽出コマンド [cat]
PDFファイルから特定のページを抽出するコマンドです。

cat実行前のPDFファイル
//input.pdfの2ページと3ページをoutput.pdfとして抽出します。
pdftk input.pdf cat 2-3 output output.pdf
cat実行後のPDFファイル

2.分割

・PDF分割コマンド [burst]
 PDFファイルを分割するコマンドです。

//input.pdfを分割し、分割したファイルをoutput_XX.pdfとして複数枚出力します。
pdftk input.pdf burst output output_%02d.pdf
burst実行前のPDFファイル
burst実行後のPDFファイル

3.ページ数取得

・PDFファイルのページ数取得[dump_data]
 input.pdfのページ数を取得するコマンドです。

//grepコマンドを併用してdump_dataのNumberOfPagesを取得してページ数を取得しています。
pdftk input.pdf dump_data | grep NumberOfPages

PDFtkを使用してのツール作成

今回、上記のPDFtkコマンドとphpを使用して、PDF抽出・分割ツールを作成しました。
PDFファイルを簡単に編集することができます。

分割選択時
抽出選択時

最後に

今回はPDFtkを使用した、PDFファイルの編集を行いました。
コマンドを入力することで、簡単にPDFファイルの編集を行うことができました。
また、今回使用したコマンド以外にも様々なコマンドがあるので、PDFの編集機能をさらに拡大できそうです。

ご覧いただきありがとうございました。

Leave a Reply

Your email address will not be published.

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>