1 はじめに1)

t検定は、t分布を用いて平均値の群間差を評価する検定です。統計学的仮説検定の中でも頻繁に用いられている検定で、通常は1標本および2標本検定に用います。t検定には、Studentのt検定をはじめとして、Welchのt検定、対応のあるt検定が挙げられます。今回紹介するStudentのt検定は、代表的なパラメトリック検定の1つであり、2つのデータ間に対応がなく、正規性および等分散性が仮定できるときに用いる方法です。この検定では、「2つのグループ間に差はない」という帰無仮説のもとで、群間差を標準化したT値を算出します。このT値が、ある与えられた自由度に対するt分布の95%区間のT値を上回る、もしくは下回った際に、最初に設定した帰無仮説が棄却され「2つのグループ間に差はある」という対立仮説が採用されます。今回は、計算例を用いながらStudentのt検定について解説していきます。

2 解析手法

2.1 ケース紹介

Studentのt検定を行う上で以下のケースを考えてみます。

各群のn数は20名ずつの被験者に対し、乳酸菌飲料を4週間摂取してもらい、1週間あたりの排便回数に対する有効性の証明を行った。摂取前から摂取4週間後の変化量に関して、摂取群とプラセボ群の平均が、それぞれ+2回/週と+1回/週であり、標準偏差は共通して1.0回/週であった。こと時、有意水準を両側5%として、Studentのt検定を用いて、群間比較せよ。

弊社では、このような解析を行うことがあります。
文章から読み取れる検定に必要な情報は以下の通りとなります。

  • (i) 臨床試験のデータ (各群の平均値と標準偏差)
  • (ii) 各群のn数/li>
  • (iii) 有意水準 (両側5%)/li>
  • (iv) 帰無仮説 (排便回数の変化量は摂取群とプラセボ群で差がない)/li>

2.2 公式

以下にStudent のt検定の公式を示しました。

摂取群の平均値をA ̅、プラセボ群の平均値をB ̅に代入し、nA、nBには各群のn数を代入します。またUABは摂取群とプラセボ群の標準偏差を合わせた全体の標準偏差であり、以下に公式を示します。

2.3 計算

【t分布表】

自由度 (ν) α = 0.025
37 2.028
38 2.026
39 2.024
40 2.023
41 2.021

計算するとT値は31.623となりました。自由度39 (n数から1を引いた値) に対する両側有意水準5%は2.024であるので、帰無仮説が棄却され被験食品群とプラセボ群の排便回数には統計学的に差があることの証明ができました。

2.4 最後に

今回のケースでは、T値がT分布の臨界値より極めて大きい値をとりました。実際、P値を算出するとPは0.001より極めて小さい値となります。ここで注意していただきたい点は、このP値が小さいから群間の差が大きいわけではないということです。T値の式を見ていただいてわかるように、T値を大きくする方法は①群間差を大きくする、②n数を増やすの2点が挙げられます。つまり、n数を増やすことで、群間差が小さくても統計学的な有意差が生じます。したがって、P値が大きいからと言って、強い有効性があると安易に判断することは問題があります。このP値の問題は、第4回『統計学的有意性を表す指標である P 値の取扱いを考える』をご覧ください。

3 まとめ

今回はStudentのt検定を紹介しました。この検定手法以外にも、様々な検定手法があります。データはあるけど、どのような解析をすればいいか、お悩みの方は是非弊社までお問合せください。

4 参考文献

1.宮井信行. 第3回差の検定 (1) -2群の標本の比較-. 学校保健研究. 2016; 58: 180-4.