LightGBM

From Wikipedia, the free encyclopedia

開発元 Microsoft and LightGBM Contributors[2]
初版 2016年 (10年前) (2016)
最新版
4.6.0 / 2025年2月15日 (13か月前) (2025-02-15)
LightGBM
作者 Guolin Ke[1] / Microsoft Research
開発元 Microsoft and LightGBM Contributors[2]
初版 2016年 (10年前) (2016)
最新版
4.6.0 / 2025年2月15日 (13か月前) (2025-02-15)
リポジトリ github.com/microsoft/LightGBM
プログラミング
言語
C++, Python, R, C
対応OS Windows, macOS, Linux
種別 機械学習, 勾配ブースティング framework
ライセンス MITライセンス
公式サイト lightgbm.readthedocs.io
テンプレートを表示

LightGBMは、Light Gradient Boosting Machine の略で、機械学習用のフリーかつオープンソースの分散型勾配ブースティングフレームワークであり、マイクロソフトが開発した[3] [4]決定木アルゴリズムをベースにしており、ランク付け、分類、その他の機械学習タスクに使用される。パフォーマンスとスケーラビリティに重点を置いて開発されている。

LightGBM フレームワークは、GBT、GBDT、GBRT、GBM、MART[5] [6]RF など、さまざまなアルゴリズムをサポートしている[7]。LightGBM は、スパース最適化、並列学習、複数の損失関数、正則化、バギング、早期停止など、 XGBoost の利点を多く備えているが、ツリーの構造が大きく異なる。多くの実装ではツリーをレベル(行)ごとに成長させるが[8]、LightGBM ではツリーをリーフ(葉)ごとに育て、損失が最も減少すると思われるリーフを選択する[9]。また、LightGBM では、XGBoost その他の実装で採用されているソートベースの決定木アルゴリズム(ソートされた特徴量に基づいて最適な分割点を探索するアルゴリズム[10])ではなく、高度に最適化されたヒストグラムベースの決定木学習アルゴリズムを実装しており、効率性とメモリ消費の両面で大きなメリットがある[11]。LightGBM アルゴリズムは、GOSS(Gradient-Based One-Side Sampling)とEFB(Exclusive Feature Bundling)という 2 つの新しい技術を採用しており、高い精度を維持しながらアルゴリズムを高速に実行することができる[12]

LightGBMは、LinuxWindowsmacOS で動作し、C++Python[13]RC# をサポートしている[14]。ソースコードはMITライセンスでライセンスされており、GitHubで公開されている[15]

GOSS

Gradient-Based One-Side Sampling(GOSS)は、GBDT のデータインスタンスにネイティブウェイトがないことを利用した手法。異なる勾配を持つデータインスタンスは、情報利得の計算において異なる役割を果たすため、より大きな勾配を持つインスタンスが情報利得に大きく貢献することになる。そのため、GOSS は情報の精度を保つために、勾配の大きいインスタンスを残し、勾配の小さいインスタンスを無作為に削除する[12]

EFB

Exclusive Feature Bundling(EFB)は、有効な特徴量の数を削減するための、ほぼロスレスな手法である。スパースな特徴量空間では、多くの特徴量はほぼ排他的であり、同時にゼロ以外の値を取ることはほとんどない。ワンホットエンコードされた特徴量は、排他的な特徴量の典型例である。EFB では、これらの特徴量を束ねて次元を下げることで、高い精度を維持しつつ効率化を図っている。このように、排他的な特徴を 1 つの特徴量として束ねたものを EFB と呼ぶ[12]

関連項目

脚注

参考文献

外部リンク

Related Articles

Wikiwand AI