質的応答均衡
From Wikipedia, the free encyclopedia
質的応答均衡(しつてきおうとうきんこう、英: Quantal response equilibrium、 QRE)とは、ゲーム理論における解概念のひとつ。リチャード・マッケルヴィとトーマス・パルフレイによってはじめて導入され、限定合理性のもとでの均衡概念を与えた。質的応答均衡は均衡の精緻化ではなく、ナッシュ均衡とはかなり違った結果を与えている。質的応答均衡は離散的な戦略についてのみ定義されているが、連続な戦略についても類似のものがある。
質的応答均衡において、プレーヤーたちはどの純粋戦略をプレーするか選ぶにあたって誤りを犯すものと仮定されている、特定の戦略が選ばれる確率は、その戦略がもたらす利得の大きさと正の相関をもつ。言いかえると、犠牲の大きい誤りは起こりにくい。
この均衡は信念が実現することから生ずる。プレーヤーの利得は、戦略の上の他のプレーヤーの確率分布に関する信念にもとづいて計算される。均衡においては、プレーヤーの信念は正しい。
実際のゲームのプレー(とくに、実験室実験)から得られたデータを解析すると、ナッシュ均衡は厳しいのかもしれない。どんな非均衡行動も同じように「間違っている」ように見えるが、現実的には、理論を棄却するために用いられるべきではない。質的応答均衡は、どの戦略も正確率でプレーされることを許容し、したがってどんなデータも不可能とはしない(そうかといってかならずしも合理的ともしない)。
ロジット均衡
質的応答均衡でもっとも一般的なものは間違いなくロジット均衡 (logit equilibrium: LQRE) である。ロジット均衡では、プレーヤーの戦略は確率分布に従って選ばれる。
- は,プレーヤー が戦略 を選ぶ確率。
- は,プレーヤー が戦略 を選ぶとき、他のプレーヤーが確率分布 に従ってプレーしていることを所与としたときに得られる期待利得。
ロジットモデルにおいてとくに興味があるのは、非負のパラメータ である(これはときに と書かれる)。 は合理性のパラメータと考えられる. となるにつれて、プレーヤーは「完全に非合理的」になり、どの戦略も等確率でプレーするようになる。 となるにつれて、プレーヤーは「完全に合理的」になり、ゲームのプレーはナッシュ均衡に近づく。