Session 4.信頼区間を知る

執筆・監修

獨協医科大学越谷病院 麻酔科 教授 浅井 隆 先生

仮説検定でわかること、わからないこと

グループ間の差の程度を知るには、信頼区間(confidence intervals, confidence limits)を確認することによって可能です。

例えば、日本の高校生の男女間で身長の差がどのくらいあるかを知りたいとしましょう。そのために、ある高校の男子学生100人と女子学生100人の身長を測定したところ、つぎのようになったとします。

仮説検定の結果からはグループ間の差の程度を知ることはできない。

ということです。ですから、グループ間の差の程度は他の方法で知る必要があります。

グループ間の差の程度は信頼区間で知る

グループ間の差の程度を知るには、信頼区間(confidence intervals, confidence limits)を確認することによって可能です。

例えば、日本の高校生の男女間で身長の差がどのくらいあるかを知りたいとしましょう。そのために、ある高校の男子学生100人と女子学生100人の身長を測定したところ、つぎのようになったとします。

男子高校生100人の平均身長は170.6cm、女子高校生100人の平均身長は157.8cm

この2グループの身長に差があるかどうかは、仮説検定で調べることが可能です。ある検定(この場合、t検定)を用いて得られたP値がつぎの通りだったとします

P<0.001

このP値を見ると、男子高校生は女子高校生に比べ有意に身長が高い、と判定することができます。しかし、このP値をいくらじっと見つめても、身長差がどのくらいかはわかりません。

ここで信頼区間の出番です。調査したグループ間の差の程度を見るのは簡単で、出された結果の差を計算することで求めることができます。

すなわち…

差は12.8cm

この差は、調査した男子高校生100人と女子高校生100人、合計200人から求めたものです。さて、もし他の200人で調査すると、男女の身長差は12.8cmになるとは限らず、おそらくこの数字より少し大きかったり小さかったりするはずです。

統計を使う場合、セッション1で確認したように、わたしたちは限られた人数を対象にして集めたデータから、本当はすべての対象者、この場合には日本の男子高校生と女子高校生の身長差を推定したいわけです。それを示してくれるのが信頼区間です。ではその結果を見てみましょう。

男女身長差の95%信頼区間:12.4-13.2cm

この読み方は簡単です。対象者から得られた差は12.8cmでしたが、それは場合によってはもう少し小さい差の12.4cmかもしれないし、逆にもう少し大きい差の13.2cmかもしれない、と解釈します。すなわち、日本の高校生の男女の身長差は12.4~13.2cmくらいだ、ということになります。

論文では、普通、まず対象者から得られた差の値、そして括弧の中に信頼区間の値が示されます。

男子高校生と女子高校生の身長の差は 12.8cm(95%信頼区間は12.4-13.2cm)であった。

このように、信頼区間を求めることにより、200人という限られた高校生の身長から、日本の高校生の男女の身長差を推定することができたことになります。

マイナス値を含む信頼区間

信頼区間の値を見ると、つぎの例のように、大きい方の値がプラス値、小さい方の値がマイナス値になっていることがあります。

関節リウマチに罹患している100人を2グループに分け、1グループで新しい鎮痛薬Aを、もう一方のグループでは従来薬Bを1ヶ月服用してもらった。1ヶ月後に胃腸症状の有無を調査した。

副作用である胃腸管症状を訴えた人は新薬Aを服用したグループでは50人中17人(34%)で、従来薬Bを服用したグループでは50人中23人(46%)であった。胃腸症状があった頻度は、グループ間に有意な差がなかった(P=0.22; 95%信頼区間:-7-31%)。

この研究の結果をわかりやすいように表にするとつぎのようになります。

結果 100人のデータ

そのため、グループ間で胃腸症状があった割合の差は…

46%-34%=12%

になります。すなわち、新薬Aを服用していた人は従来薬Bを服用していた人に比べ、12%胃腸症状を訴える確率が低かったことになります。

さて、この差の95%信頼区間を見てみると…

95%信頼区間:-7-31%

となっています。さてこの例では、95%信頼区間の低い値がマイナスになっていますが、この場合も普通通りに解釈すればむずかしくないはずです。

すなわち、

新薬Aを服用していた人が1ヵ月後に胃腸症状を訴えた率は、従来薬Bを服用していた人の率に比べて、マイナス7%からプラス31%まで低い。

となります。ということは…

新薬Aを服用していた人が1ヵ月後に胃腸症状を訴えた率は、従来薬Bを服用していた人の率に比べて、場合によっては最高31%低いかもしれないが、同時にもしかしたら最高7%高いかもしれない。

これから言えることは、「確かに調査結果では従来薬Bと比較すると、新薬Aにより副作用である胃腸症状が起こる率が低い、という結果が出たが、これは単なる個人差による偶然で、もしかしたら新薬Aの方が従来薬Bより副作用が出る確率が高い可能性もある」、という結論になります。このように、信頼区間は決してむずかしくないはずです。

参考資料
  • この内容は、「いまさら誰にも聞けない. 医学統計の基礎のキソ1-まずは統計アレルギーを克服しよう!」(浅井隆著)からアトムス出版の許可の上、引用、改変しています。