コンピュータ適応型テスト
From Wikipedia, the free encyclopedia
項目応答理論によるパラメータ
項目応答理論の詳細については、当該記事を参照。CATにおいては、困難度パラメータを用いるラッシュモデル(1PLモデル)、困難度パラメータと識別力パラメータを用いる2PLモデル、困難度パラメータ、識別力パラメータ、当て推量パラメータを用いる3PLモデルのいずれかが採用される。項目応答理論には4PLモデルもあるが、CATとして運用されているものに4PLモデルはない。
プレテスト
モデル選択
CAT構築に環境が整った大規模なテストでは3PLモデルが採用されることがあるが、プレテスト実施上の制約等により、1PLモデルあるいは2PLモデルが選択されることが多い。
アイテムプール
プレテストにより、パラメータが付与されたアイテムはアイテムプール(Item Pool)、またたアイテムバンク (Item Bank)に蓄えられる。アイテムプールの漏洩があればテストとして機能しなくなるため、アイテムプールのセキュリティ確保が重要になる。
暴露制御(Exposure control)
CATでは、アイテムが繰り返し使われる。しかし、特定のアイテムの使用頻度が高いのは好ましくない。このため、使用の偏りがないように制御することをエクスポージャ・コントロール(日本語訳「暴露制御」はまだ定着していない)という。また、長い間の運用で、いずれのアイテムも使用回数が増えていく。使用回数が一定以上になったアイテムは、アイテムプールから引退することによって、アイテムプール全体の暴露制御も行われる。
適応型(Adaptive)の仕組み
スコア
項目応答理論での項目困難度(bパラメータ)と能力推定値(θ)は理論的には±無限大である。しかし、実際のデータでは項目困難度が極端な値をとることは少ない。そのため、能力推定値も-3.0から+3.0程度の値を取る。一般にはこのθの値をそのまま示しても解釈が困難であるため、これを線形変換して得点として示す。この換算式を変えることにより、得点は10点満点でも1000点満点でも示すことができる。
CATとCBT
CATと似た用語にCBT(Computer Based Test)があるが、これは適応型である必要はなく、コンピュータ上で実施されるテスト一般(e-テスティング)を指す。例えば、紙で実施していたテストをデジタル化してコンピュータ上で実施してもCBTと呼ばれる。