Kaggle
データサイエンスコンペティションのためのオンラインプラットフォーム
From Wikipedia, the free encyclopedia
Kaggle(カグル)は企業や研究者がデータを投稿し、世界中の統計家やデータ分析家がその最適モデルを競い合う、予測モデリング及び分析手法関連プラットフォーム及びその運営会社である。 同プラットフォーム上では競技会(Competitions)の開催だけでなく、データセットの公開・共有(Datasets)、ブラウザ上の実行環境(Code)による解析・学習,学習用教材の提供(Learn)、学習済みモデルの共有(Models)などの機能も提供されている。
|
| |
| 業種 | 予測モデリング |
|---|---|
| 設立 | 2010年4月 |
| 創業者 | Anthony Goldbloom, Ben Hamner |
| 本社 | アメリカ、サンフランシスコ |
| 所有者 | Alphabet (企業) (2017–現在) |
| 親会社 | Google (2017–現在) |
| ウェブサイト |
www |
流れ
- 課題投稿者はデータ及び当該課題の説明が必須である。Kaggle社は、課題作成の支援、課題構成作成、データの匿名化などのコンサルティングを担当する。
- 参加する回答者は多様な手法を試し、最適モデル構築を目指し競い合う。大抵は暫定の評価用データに対する投稿結果が(秘匿化した課題に対する提出モデルの予測精度に基づき)採点され、順位表(Leaderboard)に掲載される。
- 期限後、多くの場合は開催中とは異なる評価用データに対する投稿結果が採点され、最終の順位表が公開される。課題投稿者が賞金を受け取る場合、投稿を再現するコードの提出が求められることが多い。その際、課題投稿者が規定するライセンス規定への準拠などが検収される。