不偏分散と母分散の違いを徹底解説｜中学生にもわかる統計の基本

この記事を書いた人

小林聡美

名前：小林聡美（こばやしさとみ）ニックネーム：さと・さとみん年齢：25歳性別：女性職業：季節・暮らし系ブログを運営するブロガー／たまにライター業も受注居住地：東京都杉並区・阿佐ヶ谷の1Kアパート（築15年・駅徒歩7分）出身地：長野県松本市（自然と山に囲まれた町で育つ）身長：158cm 血液型：A型誕生日：1999年5月12日趣味：・カフェで執筆＆読書（特にエッセイと季節の暮らし本）・季節の写真を撮ること（桜・紅葉・初雪など）・和菓子＆お茶めぐり・街歩きと神社巡り・レトロ雑貨収集・Netflixで癒し系ドラマ鑑賞性格：落ち着いていると言われるが、心の中は好奇心旺盛。丁寧でコツコツ型、感性豊か。慎重派だけどやると決めたことはとことん追求するタイプ。ちょっと天然で方向音痴。ひとり時間が好きだが、人の話を聞くのも得意。 1日のタイムスケジュール（平日）：時間行動 6:30 起床。白湯を飲んでストレッチ、ベランダから天気をチェック 7:00 朝ごはん兼SNSチェック（Instagram・Xに季節の写真を投稿することも） 8:00 自宅のデスクでブログ作成・リサーチ開始 10:30 近所のカフェに移動して作業（記事執筆・写真整理） 12:30 昼食。カフェかコンビニおにぎり＋味噌汁 13:00 午後の執筆タイム。主に記事の構成づくりや装飾、アイキャッチ作成など 16:00 夕方の散歩・写真撮影（神社や商店街。季節の風景探し） 17:30 帰宅して軽めの家事（洗濯・夕飯準備） 18:30 晩ごはん＆YouTube or Netflixでリラックス 20:00 投稿記事の最終チェック・予約投稿設定 21:30 読書や日記タイム（今日の出来事や感じたことをメモ） 23:00 就寝前のストレッチ＆アロマ。23:30に就寝

不偏分散と母分散の違いをわかりやすく解説します

データを扱うとき、ばらつきを数値で表すと便利です。ばらつきの程度を測る統計の基本は分散です。分散には「母分散」と「不偏分散」があり、名前からして意味が違います。母分散はデータ全体のばらつきを正確に表す値ですが、それを直接知るにはデータの母集団全体を知る必要があります。現実には全員のデータを集めるのは難しいことが多いですよね。だから私たちは、手元のデータだけから「母分散を推定する」方法として不偏分散を使います。不偏分散は、標本から母分散をよく近づけるように設計された推定量です。大事なポイントは、分母の数え方です。母分散 σ^2 を厳密に言うと Σ(xi-μ)^2 / N です。ここで μ は母平均です。これに対して標本から計算する場合、分母に N-1 を使います。これは「自由度」という言葉と深く関係します。自由度が 1 減ると、推定値がデータの平均を引きずって過小評価されるのを防ぐためです。実際の計算では、データ xi の平均 x̄ をまず求め、各データと平均値の差を二乗して合計します。その合計を N-1 で割ると、不偏分散 s^2 が得られます。こうして得られる s^2 は、何回も標本を取り直して平均すると、母分散 σ^2 の偏りのない推定値に近づく性質があります。この感覚は、データを分析する人が常に意識しておくべき「根本的な考え方」です。

この考え方を、日常の授業や実務の、ちょっとした例とともに理解すると、統計の難しさが少しやわらぎます。

要点の要点は「分母を n ではなく n-1 にして、標本から母分散を推定する」ことです。知識の土台づくりとして、ここをしっかり押さえましょう。

不偏分散とは何か

不偏分散とは、標本から母分散を推定する際に、推定値が母分散の長期的な平均と等しくなるように設計された公式のことである。具体的には、標本のデータ xi を使って x̄ を計算し、各 xi-x̄ の二乗和を求め、それを n-1 で割る。これを s^2 と表す。ポイントは分母が n-1 であること。なぜなら、標本平均はデータの中心を少しずらしてしまい、偏差の二乗和が過大になることが多いからだ。自由度が1減ることで、このずれを「補正」して、長い目で見たとき母分散 σ^2 の期待値に近づく。上の例をもう少し見ていこう。データ {2,4,6} を使うと、平均は 4、各データとの差は -2, 0, 2 となり、それぞれの平方は 4,0,4。合計は 8。分母を 2 で割ると 4。これが s^2 の値だ。もし分母を n で割ると 8/3 という母分散の推定値に近いかもしれないが、これは偏りがある推定になる。実際の分析では、サンプルサイズが大きいほど 8/2 と 8/3 の差は小さくなり、s^2 は母分散 σ^2 の良い推定値になる。さらに、 s^2 は他の統計手法（例えば信頼区間の計算や回帰分析の誤差項の推定）で頻繁に使われる。学術的には、これは「最小二乗法の前提となる残差の分散の推定」としても重要である。これらの点を押さえておくと、授業での問題にも強くなる。

母分散とは何か

母分散とは、母集団全体のばらつきを表す正確な指標です。記号は σ^2 で、定義は μ から各データ xi への偏差の二乗を全データ数 N で平均したものです。すなわち σ^2 = Σ (xi - μ)^2 / N です。母分散を知るとは、母集団の性質をそのまま数値で表すことを意味します。現実には μ や σ^2 を直接観測することは難しいので、私たちは標本から推定します。複数の標本を取ってそれぞれの分散を計算し、平均的な値を母分散の近似として使う方法もあります。重要なのは、母分散は「真のばらつき」を表すという点で、データがどんな分布に従っていても、全体の散らばりの程度を示す指標であるということです。標本データが十分大きく、母集団を適切に represent できていれば、推定はより安定します。

違いを覚えるコツと表の比較

覚え方のコツは「分母の違い」と「データの情報源がどこか」を意識することです。母分散は母集団全体の散らばり、分母は N。対して不偏分散は標本から母分散を推定するもので、分母は N-1。自由度という考え方を使えば、平均を使うとデータは 1 個減るので N-1 になると覚えるとよいです。実務では大きなデータが増えるほど、s^2 は σ^2 に近づきます。

この違いを一目で確認できる表を作ると理解が深まります。例えば下の表のように整理すると、混乱を避けやすいです。

<table><th>指標分母意味用途母分散N母集団全体のばらつき母集団の性質を表す真の値不偏分散N-1標本から母分散を推定する値母分散 σ^2 の推定値として使うtable>
覚えるコツとして、データが増えるほど「標本が母集団をよく代表する」確率が上がる点をイメージすると、s^2 が安定して σ^2 に近づく理由が見えやすくなります。

ピックアップ解説

今日は統計の小話。友だちのタケシとデータの話をしていて、ふと不偏分散の話題が出た。彼は母分散を知るのは難しいから“分母をなぜ n-1 にするの？”と疑問顔。私は答えた。『母集団全部を見られないとき、平均を使うたびにサンプルの中心がずれて、分散の推定が少しオーバーになるんだ。だから分母を N-1 にすることで“過大評価”を避ける調整をするんだよ』と。彼は納得。私たちはキャンパスの端のベンチで、データ点が増えるほど推定が安定していくのを図で頭に描いた。統計の話は難しく見えるけれど、実は身近な考え方。データの波を抑えたいとき、まずは分母の意味を思い出すと良い。

前の記事： « 標準偏差と母標準偏差の違いを中学生にもわかる言葉で徹底解説

次の記事：内申と評定の違いを理解するための基本ガイド—中学から高校受験まで役立つポイントをやさしく解説 »