基盤モデル
From Wikipedia, the free encyclopedia
基盤モデル(きばんモデル、英: foundation model) は、自己教師あり学習や半教師あり学習により膨大なデータで学習した大規模人工知能モデルで、 様々な下流タスクに適用することができる[1][2]。 基盤モデルは、著名なチャットボットやその他のユーザ向け AI の動力源となるなど、AI システムの構築方法に大きな変革をもたらしてきた。The Stanford Institute for Human-Centered Artificial Intelligence (HAI) の Center for Research on Foundation Models (CRFM) がこの用語を広めた[1]。
基盤モデルの初期の例は、Google の BERT や様々な初期の GPT 基盤モデル(特にOpenAIの「GPT-n」シリーズ)を含む事前訓練された大規模言語モデル(LLM)だった[3][4]。