LZ4

作者 Yann Collet

初版 2011年4月24日 (14年前)

最新版

1.10.0^[1]

/ 2024年7月22日 (14か月前)

リポジトリ

github.com/lz4/lz4

LZ4
作者	Yann Collet
初版	2011年4月24日 (14年前) (2011-04-24)

最新版	1.10.0^[1] / 2024年7月22日 (14か月前)
リポジトリ	github.com/lz4/lz4
プログラミング言語	C言語
対応OS	クロスプラットフォーム
プラットフォーム	ポータブル
前身	lha（？）
後継	Zstandard（事実上の後継？）
対応言語	日本語・英語など。
サポート状況	サポート中です。（開発中）
種別	データ圧縮、オープンソース（？）
ライセンス	二条項BSDライセンス
公式サイト	lz4.org （英語）
テンプレートを表示

LZ4は、圧縮と展開の速さに焦点を当てた可逆圧縮アルゴリズムである。バイト指向の圧縮方法であるLZ77ファミリーに属する。Yann Collet が2011年より開発している。

Yann Collet は LZ4 の開発を始めた4年後の2015年より Zstandard も開発している。

gzipのようなアルゴリズムより低い圧縮率であるLZOよりわずかに圧縮率が低い。しかし、圧縮速度はLZOと同等であり、gzipより数倍速い。展開速度はLZOより著しく速くなりうる^[2]。

Zstandard の開発者によると LZ4 と Zstandard の --fast=4 が同程度の圧縮率だが、解凍速度は LZ4 の方が速い。^[3]

設計

LZ4はデータをシーケンスの連続として表現する。それぞれのシーケンスは、2つの4ビットフィールドに分けられた1バイトのトークンで始まる。最初のフィールドは、出力にコピーされるリテラルバイトの数字で表現される。2つ目のフィールドはすでにデコードした出力バッファからコピーするバイト数を表す（0は最小の一致長である4バイトを表わす）。ビットフィールドのどちらかの値が15なら、長さがそれ以上で追加のデータがあることを示す。値が255のときは、さらにもう1バイト追加されることを示す。そのように、255の値を含む追加のバイトの並びによって任意の長さが表現される。リテラルの文字列が、追加のバイトとトークンのあとにあるなら文字列の長さを示す必要がある。この後にはオフセットが続き、出力バッファでコピーを始めるときにどれだけ戻るかを示す。（もしあればであるが、）シーケンスの終わりには一致長の追加バイトがある ^[4]。

圧縮はストリームまたはブロックで実行できる。より高い圧縮率は、最良一致を探し出すことに、より注力することで達成される。その結果より小さな出力とより速い展開速度が得られる。

実装

Yann Collet による C のリファレンス実装があり、BSDライセンスである。 Java、C#、Python などの多様な言語へのポートやバインディングがある^[5]。

表話編歴アーカイブファイルフォーマット（比較）
アーカイブのみ	ar AXF BagIt（英語版） cpio LBR（英語版） shar（英語版） tar WAD WARC
圧縮のみ	Brotli bzip2 compress gzip LZMA LZ4 lzip lzop SQ（英語版） xz Zstandard pack
アーカイブおよび圧縮	7z ACE ARC（英語版） ARJ B1（英語版） Cabinet cfs（英語版） cpt dar（英語版） DGCA .dmg .egg（英語版） GCA kgb（英語版） LHA LZX MPQ（英語版） PEA .qda RAR rzip（英語版） sit SQX（英語版） UDA（PAQ/UDA） Xar（英語版） zoo ZIP ZPAQ
ソフトウェアパッケージ	pkg (SVR4) deb pkg (macOS) RPM RUNZ MSI JAR WAR RAR (Java) EAR XPI
文書パッケージ	OEB Package Format OEBPS Container Format (EPUB) Open Packaging Conventions Office Open XML

設計

実装

利用例

参考文献

外部リンク

Related Articles