Kaggle

データサイエンスコンペティションのためのオンラインプラットフォーム From Wikipedia, the free encyclopedia

Kaggle(カグル)は企業研究者がデータを投稿し、世界中の統計家やデータ分析家がその最適モデルを競い合う、予測モデリング及び分析手法関連プラットフォーム及びその運営会社である。 同プラットフォーム上では競技会(Competitions)の開催だけでなく、データセットの公開・共有(Datasets)、ブラウザ上の実行環境(Code)による解析・学習,学習用教材の提供(Learn)、学習済みモデルの共有(Models)などの機能も提供されている。

業種 予測モデリング
設立 2010年4月
創業者 Anthony Goldbloom, Ben Hamner
概要 業種, 設立 ...
Kaggle
業種 予測モデリング
設立 2010年4月
創業者 Anthony Goldbloom, Ben Hamner
本社 アメリカサンフランシスコ
所有者 Alphabet (企業) (2017–現在)
親会社 Google (2017–現在)
ウェブサイト www.kaggle.com
テンプレートを表示
閉じる

2017年3月8日、GoogleはKaggle社を買収すると発表した[1][2]

流れ

  1. 課題投稿者はデータ及び当該課題の説明が必須である。Kaggle社は、課題作成の支援、課題構成作成、データの匿名化などのコンサルティングを担当する。
  2. 参加する回答者は多様な手法を試し、最適モデル構築を目指し競い合う。大抵は暫定の評価用データに対する投稿結果が(秘匿化した課題に対する提出モデルの予測精度に基づき)採点され、順位表(Leaderboard)に掲載される。
  3. 期限後、多くの場合は開催中とは異なる評価用データに対する投稿結果が採点され、最終の順位表が公開される。課題投稿者が賞金を受け取る場合、投稿を再現するコードの提出が求められることが多い。その際、課題投稿者が規定するライセンス規定への準拠などが検収される。

影響

公開課題方式により、HIV研究への最新技術の促進[3] 、より正確なチェスレイティング[4]など、多くの課題解決につながった。即座に反映されるスコアボードが、回答者に既存の最適解を超えた革新策を導出させる動機付けとなっている[5]。 Heritage Health Prizeによる300万ドルの賞金の課題[6] も話題となった。

情報科学統計学経済学数学などの分野から全世界で約3000万人が登録している[7]。 サイト内での成績に応じた称号(Tier)があり、参加者の技術力を示す役割も果たしている[8]

DeNAでは人材育成や技術者の勧誘などに利用している[9]

脚注

日本語の関連図書

関連項目

外部リンク

Related Articles

Wikiwand AI