耳寄りな話題

Eric's color bar icon

このページでは、

  1. 平均の差の検定における2種類の統計量の独立性と対処法
  2. 完全無作為化2要因分散分析における各効果のF統計量間の独立性と対処法
  3. 反復測定デザイン分散分析における各効果のF統計量の歪みの可能性と対処法
  4. 対人関係の歪みも複素空間上では解消?

などを掲載しています。

Eric's color bar icon

このぺーじは、平成22年5月1日に新たに開設しました。
このページは、平成22年8月13日に一部更新しました。
under construction icon


1. 平均の差の検定における2種類の統計量の独立性と全体的危険率

  1. 問題と結論

     心理学をはじめとする社会・行動科学の分野ならびに医学・歯学・薬学の一部の分 野では、データ解析に際して、統計的検定を行うことが多い。数ある統計的検定の 中でも、2群の平均の差の検定や各種分散分析は、これらの分野ではとりわけ基本 的な統計的検定法としてよく用いられている。

     しかし、これらの基本的な検定方法にも、統計学の専門家以外にはあまり知られてい ない幾つかの問題点がある。例えば、対応のない場合の2群の平均の差の検定では、 内外の標準的あるいは入門的テキストの多くでは、平均の差の検定に先立ち両群の分散の 等質性の F検定を行い、等質性が採択される場合には通常の t検定を、棄却される 場合には例えば Welch 法(Sattethwaite 法と呼ばれることもある)等による t検定 を行う、と書かれている。

     ただし、平均の差の検定、とりわけ対応のない場合の平均の差の検定には、最低2 つの大きな問題が横たわっている。1つは、 よく知られているもので、そもそも分散が異なる2群で平均の差の検定(いわゆる ベーレンス・フィッシャー問題 (the Behrens-Fisher problem))を行うことには 意味があるのか、という問題である。例えば、竹内 (1973) は、「この問題自体は 純粋な形では非現実的なものであるということができると思う」と述べている。

     対応のない場合の2群の平均の差の検定におけるもう1つの重要な問題は、この 検定では、通常 F検定とt検定という統計検定をこの順で続けて2つ行うことによる 検定全体の統計的過誤のコントロールの問題である。 これに対する対処法について記述している入門的テキストは、本邦においても欧米に おいても筆者の知る限り極めて少ない。

     そのような状況の中で、まず本邦では竹内(1973, p.19) は、上記のコントロールの 問題に対して「ここで、二つの検定の水準は、仮説 μ12、 σ12 の下で、二つの検定でともに仮説が捨てられない確率が、 ちょうど1−αになるように定めなければならない」としている。一方、永田 (2008, p.100) は「この前段階のF検定は有意水準20%で行う」としている。その理由として、彼は当該F検定 における第2種の過誤を小さくすることをあげている。ただし、この方式では、あとで 見るように、例えば第2段階の平均の差の検定における危険率を5%とすると、2種類の 検定の全体の危険率は、等分散仮説が採択される場合には、およそ24% と大きくインフレすることになる。すなわち、永田方式では、第1段階の F 検定における 第2種の過誤を小さくすることにより、結果的には上記2段階で行う全体的検定における第 1種の過誤は相対的には大きくなってしまうのである。

     われわれは、これら2つのコントロールの方式を、どう評価すべきであろうか。 まず、竹内の方式では、平均の差の検定に際しての一種の逐次検定全体の危険率の コントロールのみに言及しているのに対して、永田の方式は前段階のF検定に際して の第2種の過誤を問題にしている点が、大きく異なる。

     実は上記の問題は、広義には Kitagawa (1950) のいう推測過程論の1つの問題 とみることができ、Bancroft (1944) にはじまる予備検定 (preliminary test) の研究、 Dodge & Roming (1929) や Mahalanobis (1940) に源流があるとされ Wald (1945, 1947) が発展させた逐次解析 (sequential analysis) や、分散分析における Naik (1975)、 Marcus et al. (1976)、Holm (1979) にはじまる逐次多重比較手続き (sequential multiple-comparison procedures) の研究などとの関連の有無についても興味が尽きない が、ここでは話題を複数の統計量間の独立性の視点からのみまとめることにする。

     平均の差の検定におけるF 検定とt 検定という統計検定をこの順で続けて2つ行うことによる 検定全体の統計的過誤のコントロールの問題は、実は Hogg (1961) が既に50年ほど前に 明快に論じている。Hogg によれば、例えば、それぞれの検定の危険率をα=0.01 に取るとした場合、 全体の検定での危険率は、分散の等質性仮説が採択される場合には、 実際にはα*= 0.0199... ~ 0.02となり、危険率のインフレをまねくことになる。この問題を回避するためには、彼が指摘して いるように、

    分散の等質性仮説が採択される場合には、等質性の検定も平均の差の検定も、例えば全体の 危険率をα*= 0.05 にしたければ、個々の危険率をおよそ 0.025 に、 もしα*=0.01 にしたければ、個々の危険率をおよそ 0.005 に取る必要がある。

    この方式は、前掲の竹内 (1973, p.19) の言う方式に他ならない。

     ただし、この方式では、上記 永田の方式で検定を行う場合に比べると、当然第2種の過誤は相対的には大きくなる。それでは、 我々は平均の差の検定に際して、 Hogg 方式と永田方式のどちらを用いるべきであろうか。いずれの方式を選ぶべきかは、一般的に言えば、検定すべき問題の性質によると 言えよう。もし、我々が両群の平均に差があることを強く(あるいは慎重に) 主張したい場合には、差がないにもかかわらず差があるとする過誤率すなわち第 1種の過誤を小さくする Hogg 方式で検定を行うのが望ましかろう。これに対して、 もし我々が両群の平均に差がないことを強く(あるいは慎重に)主張したい場合には、 差があるにもかかわらず差がないとする過誤率すなわち第2種の過誤を小さくする 永田方式で検定を行うのが望ましかろう。とりわけ心理学や教育学の分野では、両群の平均に差が ないことを強く主張したい場合は少ないとすれば、Hogg 方式で検定を行うのが適切な場合が多い のではないか。

  2. 証明

     うえの問題を正確に議論するには、つぎの Hogg (1961) による定理や Basu (1955) の定理が必要 となる。さらに、これらの定理を理解するには数理統計学における幾つかの重要な基礎的概念につい ての予備知識が必要である。それらは、尤度比検定 (likelihood ratio test)、充足統計量 (sufficient statistic)、完備充足統計量(complete sufficient statistic)、局外母数 (nuisance parameter)、補助統計量 (ancillary statistic) である。

    定理 (Hogg, 1961)
      全母数空間 Ω=ω0 に対して、k 個の部分集合 ωi, i = 1,2, ..., k が Ω=ω0 ω1 ω2 ... ωk であるとする。ここで、帰無仮説 H0を対立仮説 H1に対して、次の仮説を 反復的に検定することにより検定するとする:
    (1)
     ここで、H0i の検定はH0i-1が採択されたときのみ 行うとする。この時、H0 は、すべての仮説 H01, ... , H0k が採択された時のみ、採択される。この時、H0i を H1i に対して検定するための尤度比検定統計量は、
    (2)
     そこで、H0 を H1 に対して検定するための尤度比λは、
    (3)
     一般に、λのこのような分解方法は幾通りか考えられるが、分解を適切に選べば、上記 逐次検定を行うための統計量相互がすべて統計的に独立であるようにすることがしばしば 可能である。

     ここで、次に H0iθ ωiのもとで、これらの局外母数に対する完備充足統計量が存在するとする。この 時、Basu (1955) 及び Hogg & Craig (1956) の独立性定理より、λi はこれらの完備 充足統計量と確率的に独立 (stochastically independent) である。通常、λi に 続く尤度比λi+1, ..., λkは、これらの完備充足統計量の関数なので、 λi と確率的に独立である (i=1,2, ..., k-1)。これらより、上記の条件が満たされ るならば、尤度比λ1, λ2, ... , λk は、確率的に相互に 独立である。

     分散の等質性の検定に続く平均の差の検定における2つの統計量 F と t 間の統計的独立性の問題は、 上の定理で k=2 の特別のケースである。既に述べたように、分散が等質な場合に限って F 統計量と t 統計量が統計的に独立になることは、Hogg (1961) 論文に既に上の定理の特別なケースの1つとして紹介 されている。ここでは、それを少し敷衍して以下に説明する:

     まず、2組の標本 (x11, x12, ... , x1n1)及び (x21, x22, ... , x2n2)は、それぞれ対応のない2つの 正規母集団 N(μ1, σ12)、N(μ2, σ22) から無作為に抽出されたものとする。

     この時、全母数空間 Ω=ω0 は、
    (4)
    これに対して、等分散に関わる部分空間 ω1 を、
    (5)
    さらに、等平均及び等分散に関わる部分空間 ω2 を、
    (6)
    最後に、等平均(仮説)に関わる部分空間 ω3 を、
    (7)
    とする。

     この時、まず明らかに Ω=ω0 ω1 ω2 が成り立つ。

     つぎに、分散の等質性に関する帰無仮説 H0(1): σ12= σ22のもとでの平均に関する帰無仮説 H0(2): μ12, σ1222の 検定のための2つの統計量 F 及び t が独立であることの証明は、つぎのようになる。この場合の 全母数空間 Ω=ω0に対して、H0(1) のもとでの母数空間は ω1 であり、対応する F 統計量は、
    (8)

    H0(2) のもとでの母数空間は ω2 であり、 t 統計量は、
    (9)

    である。

     ここで、Hogg (1961) の定理から、k=2 の場合、一般に次式が成り立つ:
    (10)

     ここで、(10) 式の右辺第1項(λ1)は、上記2組の標本が得られたときのデータの無条件 同時尤度の最大値に対する、H0(1) のもとでのデータの条件付き尤度の最大値 の比であるが、これが F 統計量の非線形な関数となることは容易に証明できる(例えば、Anderson, 1984, p.406)。また、(10) 式の右辺第2項(λ2)も同様な推論により t 統計量の非線形な 関数となることは容易に証明できる。

     最後に

    1. F は H0(1) のもとでの局外母数、μ1, μ2、 及び共通分散σ2、に関する補助統計量である(すなわち、F はμ1, μ2、共通分散σ2 に依存しない)。
    2. t は、μ1, μ2、共通分散σ2 に対する充足統計量 の非線形関数であり、充足性を持つ。さらに、t は完備 (Lehmann & Scheffé, 1950)なので、 完備充足統計量である。

    そこで、上記 Hogg (1961) 及び Hogg & Craig (1956) により、等分散仮説が成り立つ時、2つの統計量 F と t は統計的に互いに独立である(Q.E.D)。

     (註1)Hogg & Craig (1956) によれば、等分散仮説が成り立つ時、t 統計量はそれが中心分布か 非心分布かに関わらず独立であることが述べられている。

     (註2)同時充足統計量の組の完備性については例えば Lehmann (1983) の定理5.6、Lehmann (1986, p.142) の定理1、あるいは Barndorff-Nielsen (1978) Lemma 8-2 を参照のこと。

     (註3)上記の議論についての詳細は、つぎの論文(印刷中)を参照のこと:
       千野直仁 (2010). 統計量間の独立性とその周辺(1) 愛知学院大学心身科学部紀要第6号.

 

Eric's back icon


2.完全無作為化2要因分散分析における各効果のF統計量間の独立性と対処法

 

Eric's back icon


3. 反復測定デザイン分散分析における各効果のF統計量の歪みの可能性と対処法

 

Eric's back icon


4.対人関係の歪みも複素空間上では解消?

 

Eric's back icon

Eric's color bar icon

この頁についてのご質問や感想は、つぎの電子メールでお送り下さっても構いません: chino@dpc.aichi-gakuin.ac.jp