|
![]() 第2回 平均値の推定と検定
![]() 国立医薬品食品衛生研究所 安全情報部
客員研究員(元食品部長) 松田 りえ子 はじめに(第1回の復習)第1回(SUNATEC e-Magazine vol.147)では、母集団の性質と標本の関係を解説した。 第2回では、以上の母集団の性質と標本の関係から、母平均を推定・検定する方法を解説する。 母平均の推定多くの状況では、母平均 μや母分散 σ2は未知であり、標本平均 前提として、母集団は正規分布しているとする。正規分布する母集団から無作為に抽出した標本の平均(標本平均) 例 採取した100試料中の物質Aの濃度を測定したところ、100個の測定結果の平均値(標本平均)が0.0254 mg/kg、標準偏差(標本標準偏差)が0.0067 mg/kgであった。このとき母平均の95%区間は これまでの解説は大標本の場合であるが、標本の数が少ない小標本では、成立しない仮定がある。大標本であれば標本分散s2は母分散σ2とほぼ等しいと期待されるが、小標本では標本分散が広い範囲に分布するので、標本平均の分布の標準偏差が 母平均の検定検定は、母集団の性質(割合、平均、標準偏差)に仮説を立て、標本の値に基づいて真偽を決定することである。第1回の統計的推論の例で示した、「ある測定の結果が10以上である確率は0.9である」という仮説を、実際の測定により否定したのは、割合の検定の一例である。 母平均の検定基準になる値(成分量の下限値、農薬濃度の上限値など)があって、試料を測定した平均と基準になる値を比較することは、よく行われている。これは、実際には母平均の検定を行っているが、必ずしも意識されていないし、正しく行われていないことも多い。
平均の差の検定平均の差の検定は、2つの標本が同じ母集団から得られたかどうかを検定する。この時の帰無仮説は、「2つの標本が採られた母集団の母平均は等しい。」である。
で計算される。仮説から μ1=μ2なので、tは3.585になる。自由度は5+7-2=10であり、t(10,0.05)=2.228である。標本から求めたt値(3.585)はこれより大きいため仮説 μ1=μ2は否定され、条件1と条件2の結果の平均値は等しいとは言えないと結論される。 計画2では、条件1の平均値は0.7968、標準偏差は0.2317、条件2の平均値は0.8724、標準偏差は0.2409である。このデータに、上記で説明した対応のないデータの平均値の差の検定を行うと、t=0.2459であり、t(8, 0.05)=2.306よりも小さいので、「平均値は等しい。」という仮説は否定されない。しかし、データをグラフにしてみると分かるように、常に条件2の方が大きな値を与えている。 それなのに、検定で2つの平均値が等しいという仮説が否定されないのは、差の分散にそれぞれの試料の濃度の変動が含まれたため、tの計算式の分母が大きくなってしまったからである。このような場合には、対応のあるデータの差dの母平均が0であるかを検定する。帰無仮説はd=0である。 帰無仮説検定では、まず検定する内容を否定する仮説をたてる。この仮説を、帰無仮説あるいはゼロ仮説と呼ぶ。上の例では、「母平均は0.5である。」あるいは「差の平均は0である。」が帰無仮説となる。 危険率検定では、帰無仮説が正しい場合に起こる事象の範囲を定め、それと実際に得られた結果を比較する。得られる結論は、 不偏推定値推定値の期待値が母数に等しいとき、その推定値は不偏推定値である。不偏推定値が複数あるとき、それらの中で分散が最小のものが、最良不偏推定値である。 (戻る) 信頼区間の意味 「95%信頼区間中に母平均μが含まれる確率は95%である。」と説明されることが多い。 (戻る) t分布下の図の左は自由度2のt分布と正規分布を示している。t分布は正規分布に比べて、中央の確率密度は小さく、両端の広がりは大きい。右は、自由度が異なるt分布を示す。自由度が大きくなると、t分布は正規分布に近づく。
(戻る) 平均値の信頼区間において、標準偏差sの係数である
標本の大きさnが大きくなるとともに、 (戻る) 略歴松田 りえ子(まつだ りえこ) 1977年 京都大学大学院薬学研究科修士課程終了 サナテックメールマガジンへのご意見・ご感想を〈e-magazine@mac.or.jp〉までお寄せください。 |
![]() |
Copyright (C) Food Analysis Technology Center SUNATEC. All Rights Reserved. |