1 概要

データ解析において統計学的な検定を行いますが、一般的な統計モデルは正規分布を仮定したもので、t検定や分散分析などは一般線形モデルと呼ばれています。一般線形モデルでは、目的変数 yは正規分布に従い、説明変数 xによらず、 Yの分布の標準偏差が一定であることを仮定したものになります。しかし、臨床試験において正規分布に従わないデータも存在し、この場合一般線形モデルでは対応が困難となってしまいます。正規分布に従わないデータを組み込むための統計モデルに一般化線形モデル (Generalized Linear Model: GLM) というものがあります。今回は線形モデルからGLMへの拡張について紹介します。

2 一般化線形モデル

一般化線形モデルは、正規分布に従わないデータに対して採用されるモデルで、誤差構造 (error structure) 、リンク関数 (link function) 、および線形予測子 (linear predictor) の 3 つの要素によって構成されています。正規分布以外の確率分布を扱うことができ、GLMは一般線形モデルの拡張したモデルとなっています。

2.1 誤差構造、リンク関数と線形予測子

誤差構造は任意の指数分布族型 (ポアソン分布や二項分布など) の確率分布を仮定してデータを変換せずに扱うため,直接パラメータを推定すること可能となります。また、従属変数が正規分布に従わないの式をモデル化すると、正確さが失われてしまいます。そこで、従属変数を対数変換してから、モデル化することで、モデルの正確さが向上することが知られています。すなわち、となり、この左辺をリンク関数と呼びます。また、右辺を線形予測子と呼びます。

2.2 ポアソン回帰モデルの算出

カウントデータなどに有効なポアソン回帰モデルはGLMの1つで、誤差構造をポアソン分布に従うと仮定した場合、期待値と分散は以下のようになります。

ポアソン分布に従うデータを回帰分析する場合、のような式を組み、観測されたy_iのデータは平均λ_iに従います。ここで、先ほどの従属変数を対数変換すると、となります。この式に任意の数値を代入することで確率を求めることが出来ます。

3 まとめ

ヒト臨床試験においても、正規分布に従わないデータが存在しており、その場合にはGLMを用いて回帰分析を実施する際に、高い精度で予測することが可能となります。GLMの応用としてロジスティック回帰や一般化線形混合モデルなどがあり、より現実的な統計モデルとなり介入効果を高めることができます。統計モデルを正しく理解し活用することでより良い結果を得ることが出来るようになります。

4 参考文献

  • 久保 拓弥, データ解析のための統計モデリング入門 一般線形化モデル・階層ベイズモデル・MCMC,岩波書店 2012

ヒト臨床試験 (ヒト試験) で得られる結果は、様々な誤差を含んでいます。この誤差を小さくすることで介入効果を増大させることができます。オルトメディコは、多分野の専門家を有するため、様々なアプローチにより誤差を最小化する試験運営が可能です。引き続き、皆様にご満足いただけるような高品質なヒト試験を提供させていただきますので、今後ともどうぞ宜しくお願い申し上げます。

この記事をPDFでダウンロードする