PDF圧縮方法を理解する
PDFファイルのサイズは数キロバイトから数百メガバイトまで幅があります。その違いはほぼ完全にコンテンツの種類と圧縮の効率によって決まります。テキストのみの文書は本質的に小さいです。高解像度の写真、埋め込みフォント、複雑なグラフィックスを含む文書は巨大になり得ます。 PDF圧縮はファイルのさまざまなコンポーネントにさまざまな技術を適用してファイルサイズを縮小します。これらの技術を理解することで、圧縮設定について情報に基づいた決定を下し、どのような結果が期待できるか予測できます。 このガイドではPDF圧縮が内部でどのように機能するか、どのようなトレードオフがあるか、ファイルサイズと品質の最適なバランスを達成する方法を説明します。
画像圧縮:最大の要因
画像は通常PDFのファイルサイズの80〜95%を占めます。したがって画像の圧縮が最も影響力のある最適化です。PDFはいくつかの画像圧縮方法をサポートしています。JPEG圧縮は写真に非可逆圧縮を適用し、目に見える品質低下を最小限に抑えながら劇的なサイズ縮小を達成します。JPEG2000は同じ品質レベルでJPEGより高い圧縮率を提供します。Flate(ZIP)圧縮はロスレスで、図表やスクリーンショットのような大きな単色領域を持つ画像に効果的です。CCITT圧縮はスキャンテキストのような白黒画像に特化しています。ダウンサンプリングは画像解像度を下げるもので、ほとんどのPDFが画面表示に必要な解像度より高い画像を含んでいるため、単独で最も効果的なサイズ縮小技術であることが多いです。
- 1画像は通常PDFのファイルサイズの80〜95%を占めます。
- 2したがって画像の圧縮が最も影響力のある最適化です。
- 3PDFはいくつかの画像圧縮方法をサポートしています。
- 4JPEG圧縮は写真に非可逆圧縮を適用し、目に見える品質低下を最小限に抑えながら劇的なサイズ縮小を達成します。
テキストとフォントの最適化
テキスト自体はコンパクトですが、フォントは大きなサイズを追加する可能性があります。1つの埋め込みフォントでPDFに100KB〜500KBが追加されることがあります。フォントサブセッティングは完全なフォントではなく文書で実際に使用されている文字のみを含めることでこれを削減します。フォントの50文字しか使用していない場合、サブセッティングにより未使用の他の何千もの文字が削除されます。ストリーム圧縮はテキストの配置やページコンテンツを表す内部データストリームにFlateエンコーディングを適用します。オブジェクト重複排除は同一のオブジェクト(繰り返される画像や同一のページなど)を識別し、複数の参照を持つ1回のみ保存します。これらの技術はテキストの多い文書で通常10〜30%の節約をもたらします。
非可逆圧縮 vs ロスレス圧縮
これは圧縮における根本的なトレードオフです。ロスレス圧縮は品質を一切損なわずにサイズを縮小します。元のデータのすべてのビットが完全に保持され復元可能です。欠点はロスレス圧縮率が控えめで、既に圧縮されたコンテンツで通常2:1〜4:1であることです。非可逆圧縮は人間の視覚にはあまり感知できない情報を破棄することで、はるかに高い圧縮率を達成します。例えばJPEG圧縮は目がほとんど気づかない高周波の色の詳細を除去します。適度な設定では品質の違いは見えません。積極的な設定ではアーティファクトが目立つようになります。選択は用途に依存します:アーカイブ文書にはロスレス圧縮を、画面表示用の文書には非可逆圧縮を安全に使用できます。
適切な圧縮レベルの選択
ほとんどの圧縮ツールは品質プリセットを提供しています。低圧縮は控えめなサイズ縮小で最大品質を保持し、印刷品質の文書やアーカイブに適しています。中圧縮は品質とサイズのバランスが良く、ほとんどの画面表示やメール共有に適しています。高圧縮は品質をある程度犠牲にしてサイズ縮小を最大化し、ウェブ公開や小さなファイルサイズが重要な状況に適しています。LazyPDFは圧縮にGhostscriptを使用しています。すべての文書コンポーネントにインテリジェントな最適化を適用する業界標準エンジンです。日常のほとんどの用途では、中圧縮が最適なトレードオフを提供します:画面表示で知覚できない品質低下で大幅なサイズ縮小を実現します。
よくある質問
品質を一切落とさずにPDFを圧縮できますか?
はい、ただしサイズ縮小は控えめです。フォントサブセッティング、オブジェクト重複排除、ストリーム圧縮などのロスレス技術は品質を損なわずにサイズを縮小します。大幅なサイズ縮小には、通常ある程度の非可逆画像圧縮が必要です。
圧縮したPDFがまだ大きいのはなぜですか?
PDFに多くの高解像度画像が含まれている場合、積極的な圧縮でも比較的大きなファイルが残ることがあります。画像が既に圧縮されていて、さらなる縮小の余地がない可能性もあります。意図する用途に合わせて画像解像度を下げられないか検討してください。
PDFを圧縮するとテキストに影響しますか?
いいえ。PDF内のテキストは既に非常にコンパクトで、ロスレスで圧縮されています。圧縮は主に埋め込み画像に影響します。テキストは適用する圧縮レベルに関係なく鮮明で、選択可能で、検索可能なまま保たれます。