ゴールドスタンダード (検査)
From Wikipedia, the free encyclopedia
医学および医療統計学において、ゴールドスタンダード(gold standard)、標準基準(criterion standard)[1]、または参照基準(reference standard)[2]は、「妥当」な条件下において利用可能な最良の診断検査またはベンチマークを指す[3]。これは、新しい検査の妥当性を評価するために比較される検査であり、治療効果の評価にも使用される[1]。
「ゴールドスタンダード」の意味は、実際の医療と統計上の理想では異なる場合がある。医学的な状態によっては、剖検によってのみ診断の確実性を保証できる場合がある。このような場合、ゴールドスタンダード検査は患者の生命を救うための最善の検査であり、また、ゴールドスタンダード検査であっても、診断を確定または否定するために追跡調査が必要になることがある[4]。
医学研究における今日の意味での「ゴールドスタンダード」という用語は、1979年にRuddによって、通貨の金本位制に言及して作られた[5]。
医学において
科学的根拠が評価される一般的な臨床的エンドポイントを指して「ゴールドスタンダード」と呼ぶことがある。たとえば、蘇生研究における薬剤や処置の「ゴールドスタンダード」検査は、神経学的損傷のない生存者が病院から歩いて退院する数が増加するかどうかである[6]。別の種類の医学研究では、30日死亡率の有意な減少をゴールドスタンダードとみなす場合もある[要出典]。
AMAスタイルガイドでは、「ゴールドスタンダード」(gold standard)ではなく「標準基準」(criterion standard)という表現が推奨されている。他の学術誌でも、投稿規定でこの用法を義務付けている。たとえば Archives of Biological Medicine and Rehabilitation 誌では、この用法を指定している[7]。しかし実際には、少なくともAMAの学術誌では、著者によるこの用語の採用や編集スタッフによる徹底は著しく不十分である[8]。
基準が臨床検査診断法の全体に及ぶ場合、通常これは臨床症例定義と呼ばれる。特定の診断方法を評価する基準として異なる症例定義を使用すれば、大きく異なる結果を生じる可能性がある[9]。
診断検査への適用
理想的な「ゴールドスタンダード」検査とは、疾病の存在に関する感度は100%(明確な病状を持つすべての患者を特定でき、偽陰性の検査結果を出さない)であり、かつ特異度は100%(疾患を持たない患者を誤って疾患患者と特定せず、偽陽性の検査結果を出さない)である。しかし実際には、真のゴールドスタンダード検査と呼べるものは存在しない[10]。
ときには代替法が十分に検討されないまま、あるいは欠点があるにもかかわらず、ある検査が高く評価されてゴールドスタンダードであると明言されることがある[11]。
新しい診断方法が利用可能になるにつれ、「ゴールドスタンダード」検査は時とともに変わる可能性がある。たとえば大動脈解離の診断の場合、かつては大動脈造影法がゴールドスタンダードであったが、感度83%、特異度87%と低いものであった。磁気共鳴画像法(MRI)の進歩により、感度95%、特異度92%の高い精度を持つ磁気共鳴血管画像法(MRA)が大動脈解離の新たなゴールドスタンダードとなった[要出典]。新しい検査法が広く受け入れられるまでは、以前の検査法が「ゴールドスタンダード」の地位を保っていた。