質的応答均衡

From Wikipedia, the free encyclopedia

質的応答均衡(しつてきおうとうきんこう、: Quantal response equilibriumQRE)とは、ゲーム理論における解概念のひとつ。リチャード・マッケルヴィ英語版トーマス・パルフレイ英語版によってはじめて導入され、限定合理性のもとでの均衡概念を与えた。質的応答均衡は均衡の精緻化ではなく、ナッシュ均衡とはかなり違った結果を与えている。質的応答均衡は離散的な戦略についてのみ定義されているが、連続な戦略についても類似のものがある。

質的応答均衡において、プレーヤーたちはどの純粋戦略をプレーするか選ぶにあたって誤りを犯すものと仮定されている、特定の戦略が選ばれる確率は、その戦略がもたらす利得の大きさと正の相関をもつ。言いかえると、犠牲の大きい誤りは起こりにくい。

この均衡は信念が実現することから生ずる。プレーヤーの利得は、戦略の上の他のプレーヤーの確率分布に関する信念にもとづいて計算される。均衡においては、プレーヤーの信念は正しい。

実際のゲームのプレー(とくに、実験室実験)から得られたデータを解析すると、ナッシュ均衡は厳しいのかもしれない。どんな非均衡行動も同じように「間違っている」ように見えるが、現実的には、理論を棄却するために用いられるべきではない。質的応答均衡は、どの戦略も正確率でプレーされることを許容し、したがってどんなデータも不可能とはしない(そうかといってかならずしも合理的ともしない)。

ロジット均衡

質的応答均衡でもっとも一般的なものは間違いなくロジット均衡 (logit equilibrium: LQRE) である。ロジット均衡では、プレーヤーの戦略は確率分布に従って選ばれる。

は,プレーヤー が戦略 を選ぶ確率。
は,プレーヤー が戦略 を選ぶとき、他のプレーヤーが確率分布 に従ってプレーしていることを所与としたときに得られる期待利得。

ロジットモデルにおいてとくに興味があるのは、非負のパラメータ である(これはときに と書かれる)。 は合理性のパラメータと考えられる. となるにつれて、プレーヤーは「完全に非合理的」になり、どの戦略も等確率でプレーするようになる。 となるにつれて、プレーヤーは「完全に合理的」になり、ゲームのプレーはナッシュ均衡に近づく。

動学ゲームに対して

批判

参考文献

Related Articles

Wikiwand AI