画像圧縮
From Wikipedia, the free encyclopedia
非可逆圧縮の方法
画像圧縮には、可逆圧縮と非可逆圧縮とがある。可逆圧縮は、圧縮前と圧縮・展開後のデータが完全に等しくなるもので、アーカイブ目的に適しており、医療用画像、図面、クリップアート、漫画など、圧縮によるデータの情報量の減少を避けたいものに対してよく使われる。非可逆圧縮方式は、圧縮前と圧縮・展開後のデータが完全には一致しないもので、人間が認知できない、もしくは認知するのが難しい部分の情報量を大幅に減らすことでデータのサイズを小さくすることが可能になる。ただし、特に低ビットレートで使用される場合、画像の歪みである圧縮アーティファクトが発生してしまう場合があるため、写真のような細部の情報が欠落してもさほど問題にならない画像に適している。非可逆圧縮のうち、違いが人間の視覚では認知できないほどごく僅かなものは、視覚的ロスレスと呼ばれる。
- 変換コーディング –最も一般的に使用される。
- 離散コサイン変換 (Discrete Cosine Transform, DCT)–最も広く使用されている非可逆圧縮の形式。フーリエ変換の一種であり、en:Nasir Ahmed、T.Natarajan、およびen:K.R. Raoによって1974年に開発された[2]。DCTは、離散コサイン変換の一種としての文脈で「DCT-II」と呼ばれることがある。これは一般に、最も効率的な形式の画像圧縮とされている。
- 近年開発されたウェーブレット変換も広く使用されており、量子化とエントロピーコーディングがそれに続く利用頻度である。
- 色空間を画像の最も一般的な色に減らす方法もある。選択した色は、圧縮画像のヘッダーにあるカラーパレットで指定される。各ピクセルは、カラーパレット内の色のインデックスを参照するだけである。この方法をディザリングと組み合わせて、不必要なポスタリゼーションを回避することができる。
- クロマ・サブサンプリング - 人間の目は色の変化よりも明るさの変化をよりはっきりと認識するという特性を生かし、画像の一部の色情報を平均化または低下させることによりデータを小さくする。
- フラクタル圧縮
可逆圧縮の方法
その他の特性
特定の圧縮率(またはビットレート)で最高の画質にすることが画像圧縮の主な目標だが、画像圧縮方式には他にも重要な特性がある。
- スケーラビリティ
- 通常、解凍および再圧縮を伴わないビットストリームまたはファイルの操作によって生じる品質の低下を指し、プログレッシブコーディングまたは埋め込みビットストリームといった別名がある。スケーラビリティは、Webブラウザーで画像をダウンロードしながらプレビューしたり、データベースなどへさまざまな品質のアクセスを提供したりする際に特に役立つ。可逆圧縮においては、粗いピクセルから細かいピクセルへのスキャンという形で見られる場合がある。スケーラビリティにはいくつかのタイプがある。
- 品質プログレッシブまたはレイヤープログレッシブ - ビットストリームは、再構成された画像を連続的に精緻化する。
- 解像度プログレッシブ - 最初に低解像度でエンコードし、次にその差分をより高い解像度にエンコードする[3][4]。
- コンポーネントプログレッシブ - 最初にグレースケールバージョンをエンコードし、次にフルカラーを追加する。
- 関心領域のコーディング
- 画像の特定の部分を、他の部分よりも高品質でエンコードする。これはスケーラビリティと組み合わせることができる(関心領域を最初にエンコードし、他の部分を後でエンコードする)。
- メタ情報
- 圧縮データには、画像の分類、検索、または参照に使用できる画像に関する情報が含まれている場合があります。このような情報には、色とテクスチャの統計、小さなプレビュー画像、作者または著作権情報が含まれる。
- 処理能力
- 圧縮アルゴリズムは、エンコードとデコードに異なる量の処理能力を必要とする。 一部の高圧縮アルゴリズムは、高い処理能力を必要とする。
- 圧縮方法の品質
- 圧縮方法の品質は、多くの場合ピークS/N比によって測定される。画像の非可逆圧縮によって導入されるノイズの量を測定する。ただし、視聴者の主観的な判断も重要な指標となる。
