確率的オウム

確率的オウム（かくりつてきオウム、英語: stochastic parrot）は、機械学習による大規模言語モデルはもっともらしい言語を生成できるものの、処理対象の言語の意味を理解してはいないという理論を説明する比喩である^[1]^[2]。この用語はエミリー・M・ベンダーによって作られた^[2]^[3]。2021年の人工知能研究論文「On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜 」（日本語: 確率的オウムの危険性について: 言語モデルは大きすぎることがあり得るのか?）において、ベンダー、ティムニット・ゲブル、アンジェリーナ・マクミラン-メジャー、マーガレット・ミッチェル (科学者)（英語版）によって発表された^[4]。

この用語は、ベンダー、ティムニット・ゲブル、アンジェリーナ・マクミラン-メジャー、およびマーガレット・ミッチェル（偽名「シュマーガレット・シュミッチェル」を使用）による論文「On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜」で初めて使われた^[4]。筆者らは、巨大な大規模言語モデル (LLM) がもたらしうる環境的あるいは経済的なコストや、説明不可能な未知の危険なバイアスを持っている可能性、また虚偽の作成に使われる可能性を指摘した^[5]。さらには、LLMは学習対象に含まれる概念を理解できないのだと主張した^[5]。ゲブルとミッチェルはこの論文を発表したことでGoogleを解雇されたとされ、Googleの従業員による抗議を引き起こした^[6]^[7]。

「確率的オウム」という訳語のなかの「確率的」の英語表記「stochastic」は、「推測に基づく」または「ランダムに決定された」ということを意味する古代ギリシャ語の「stokhastikos」に由来する^[8]。「オウム」は、LLMが意味を理解せず単に言葉を繰り返しているということを指す^[8]。

ベンダーらの論文では、LLMが意味を考慮せずに単語や文を確率的に連鎖しているだけであるため、単なる「確率的オウム」なのだと主張されている^[4]。

機械学習の専門家であるリンドホルムらによると、この比喩は次の二つの重要な問題を示すものである^[1]^[2]。

LLMは訓練されたデータに依存しており、単にデータセットの内容を確率的に繰り返しているに過ぎない。
出力は訓練データに基づいて生成されているのであり、LLMは自分が間違ったことや不適切なことを言っているかどうかを理解していない。

リンドホルムらは、質の低いデータセットやその他の制限により、機械学習に基づくシステムが危険なほど間違った結果を生み出すことがありうると指摘している^[1]。

使用

2021年7月に、アラン・チューリング研究所（英語版）がベンダーらの論文^[4]に関する基調講演とパネルディスカッションを開催した^[9]。2023年5月 (2023-05)現在^[update]、同論文は1,529の出版物で引用されている^[10]。「確率的オウム」という用語は、法学^[11]、文法^[12]、ナラティブ^[13]、および人文学の分野の出版物で使用されている^[14]。著者らは、GPT-4のような大規模言語モデルに基づくチャットボットの危険性についての懸念を引き続き抱いている^[15]。

確率的オウムは現在、AI懐疑論者が機械が出力の意味を理解していないことを指すために使用される造語であり、時には「AIに対する侮辱」として解釈される^[8]。この用語はOpenAIのCEOであるサム・アルトマンが皮肉を込めて「i am a stochastic parrot and so r u (ぼくも君たちも確率的オウムじゃないか)」とツイートしたことでさらに広まった^[8]。「確率的オウム」は、「ChatGPT」や「LLM」といった言葉を押しのけて、2023年のアメリカ方言学会によるAI関連の年間最優秀語に選ばれた^[8]^[16]。

この用語は、一部の研究者によって、LLMは膨大な量の訓練データを通じて人間のようなもっともらしいテキストを生成するパターン処理システムであると説明するために使われる。しかし、LLMは言語を実際に理解していると主張する研究者も存在する^[17]。

議論

一部の大規模言語モデル(LLM)、例えばChatGPTは人間らしい会話を可能としている^[17]。このような技術の進展により、LLMが言語を本当に理解しているのか、単に「オウム返し」をしているだけなのかという議論が深まっている。

主観的経験

人間の心の中では、言葉や言語は自分が経験したものに対応しているが^[18]、LLMの言葉は単に学習データに含まれる言葉やパターンと対応しているだけかもしれない^[19]^[20]^[4]。確率的オウムという概念の支持者は、LLMが実際には言語を理解できないと結論付けている^[19]^[4]。

ハルシネーションと間違い

LLMが架空の情報を事実として提示する傾向もそういった主張を裏付けている^[18]。この現象はハルシネーション（幻覚）と呼ばれ、LLMが現実とは異なる情報を堂々と生成する現象である^[19]^[20]^[18]。LLMが事実と虚構を区別できないことを根拠に、言葉を現実世界の理解と結び付けられていないのだという主張がある^[19]^[18]。さらに、LLMは言語の意味理解が必要な複雑・曖昧な文法を解釈できないことがよくある^[19]^[20]。Sabaらの例を借りると、次のようなプロンプトである^[19]。

テーブルから落ちた濡れた新聞が私の好きな新聞だ。でも最近、私の好きな新聞が編集者を解雇したので、もう読みたくなくなるかもしれない。2文目で「私の好きな新聞」を「テーブルから落ちた濡れた新聞」に置き換えられますか?

LLMはこれに対して肯定的に応答し、2つの文脈で「新聞」の意味が異なることを理解できなかった。1つ目では物体を、2つ目では組織を指している^[19]。このような失敗に基づき、LLMを確率的オウムに過ぎないと結論付けるAI専門家が存在する^[19]^[18]^[4]。

ベンチマークと実験

LLMが確率的オウムであるという主張に対する反論のひとつは、推論力、常識、言語理解に関するベンチマーク結果を持ち出すものである。2023年には、一部のLLMがSuperGLUEなど様々な言語理解テストで良好な結果を示した^[20]^[21]。このようなテストとLLMの応答の自然さから、2022年の調査では51%のAI専門家が、十分なデータを与えられればLLMが言語を真に理解できると考えている^[20]。

ある研究者はChatGPT-3での実験を行った結果、このモデルは確率的オウムなのではなく、重大な推論能力の制限があるだけだと主張した^[17]。プロンプトに含まれる情報に基づいて将来の出来事を予測する上では、モデルは首尾一貫しており有益な情報を提供していた^[17]。また、ChatGPT-3はプロンプトの文面に含まれないユーザの意図（サブテキスト）を解釈できることが多々あった。しかし、論理や推論、特に空間認識を伴うプロンプトにおいて頻繁に失敗する^[17]。モデルの応答の質が様々であることから、LLMは特定のタスクでは何らかの「理解」を持っているものの、その他のタスクでは確率的オウムのように振る舞うことが示唆される^[17]。

解釈可能性

LLMが何かを理解しているかどうかを調べる別の手法は「機構的解釈可能性 (英語: mechanistic interpretability)」と呼ばれるものである。これはLLMをリバースエンジニアリングして、内部でどのように情報を処理しているかを分析する手法で、一例としてOthello-GPTについての研究がある。これは、小さなTransformerをトレーニングさせてオセロの合法手を予測させるものである。このモデルの内部ではオセロの盤面が線形表現されていることが分かっており、その表現を変更すると予測される合法手が正しく変わる^[22]^[23]。

別の例として、小規模なTransformerにプログラミング言語Karelで書かれたコンピュータプログラムを学習させた研究がある。Othello-GPTの例と同様に、このモデルはKarelプログラムの意味論に関する内部表現を獲得し、この表現を変更すると出力が適切に変化した。さらに、このモデルは訓練データセットよりも平均して短いプログラムを正しく生成可能だった^[24]。

推論のショートカット

人間の言語理解能力をテストするために作られたテストをLLMに使うと、テキストデータ内の偶発的な相関関係によって実際よりも良い結果が出ることがある^[25]。人間のような理解をするのではなく、データ内の無関係な相関関係を捉えてしまう「ショートカット学習」を起こすのである^[26]。2019年に行われた実験で、GoogleのBERT言語モデルに議論理解タスクが与えられた。2つの文から議論とより一致しているほうを選ばせるもので、以下がその一例である^[20]^[27]。

議論: 重罪人にも投票権を与えるべきだ。17歳で車を盗んだ人間からは一生涯市民権を剥奪する、ということは認めるべきではない。
文A: 自動車重窃盗は重罪である。
文B: 自動車重窃盗は重罪ではない。

研究者は、「ではない (not)」のような特定の語をヒントとして言語モデルが正解を導いていることを発見した。そうした単語が含まれれば完璧に近い成績だが、ヒントとなる語を外すとランダムな選択になってしまう^[20]^[27]。このような問題と、知性を定義する難しさから、LLMの理解能力を示すベンチマークにはすべて欠陥があり、理解を装った「ショートカット」を許してしまっていると主張されることがある。