確率分布関数と累積分布関数の違いを中学生にもわかるように徹底解説！

この記事を書いた人

小林聡美

名前：小林聡美（こばやしさとみ）ニックネーム：さと・さとみん年齢：25歳性別：女性職業：季節・暮らし系ブログを運営するブロガー／たまにライター業も受注居住地：東京都杉並区・阿佐ヶ谷の1Kアパート（築15年・駅徒歩7分）出身地：長野県松本市（自然と山に囲まれた町で育つ）身長：158cm 血液型：A型誕生日：1999年5月12日趣味：・カフェで執筆＆読書（特にエッセイと季節の暮らし本）・季節の写真を撮ること（桜・紅葉・初雪など）・和菓子＆お茶めぐり・街歩きと神社巡り・レトロ雑貨収集・Netflixで癒し系ドラマ鑑賞性格：落ち着いていると言われるが、心の中は好奇心旺盛。丁寧でコツコツ型、感性豊か。慎重派だけどやると決めたことはとことん追求するタイプ。ちょっと天然で方向音痴。ひとり時間が好きだが、人の話を聞くのも得意。 1日のタイムスケジュール（平日）：時間行動 6:30 起床。白湯を飲んでストレッチ、ベランダから天気をチェック 7:00 朝ごはん兼SNSチェック（Instagram・Xに季節の写真を投稿することも） 8:00 自宅のデスクでブログ作成・リサーチ開始 10:30 近所のカフェに移動して作業（記事執筆・写真整理） 12:30 昼食。カフェかコンビニおにぎり＋味噌汁 13:00 午後の執筆タイム。主に記事の構成づくりや装飾、アイキャッチ作成など 16:00 夕方の散歩・写真撮影（神社や商店街。季節の風景探し） 17:30 帰宅して軽めの家事（洗濯・夕飯準備） 18:30 晩ごはん＆YouTube or Netflixでリラックス 20:00 投稿記事の最終チェック・予約投稿設定 21:30 読書や日記タイム（今日の出来事や感じたことをメモ） 23:00 就寝前のストレッチ＆アロマ。23:30に就寝

確率分布関数と累積分布関数の違いを理解するための基本

この記事では「確率分布関数」と「累積分布関数」という言葉の意味と違いを、中学生にもわかる例と図解を使って丁寧に解説します。まず大事なポイントは、これらの名前が混同されがちですが、実は現場で使われる意味にはズレがないことが多い、ということです。厳密には「累積分布関数」が正式な名称で、ある値以下になる確率を表します。一方、日常的には「確率分布関数」という言葉がCDFの代替として使われることもあります。さらに理解を深めるには「確率密度関数（PDF）」との関係も見るとスッキリします。

この先の説明では、まず離散分布と連続分布の違いを押さえ、そのうえで実際の数値の例を出して、どのように読み解けばよいかを学びます。どうぞゆっくり読み進めてください。

確率分布関数とは何か

確率分布関数は、ある値以下になる確率を表す関数です。Xを「起こりうる結果を表す数値」、xを観測値とすると、F(x)=P(X≤x)となります。離散分布では階段状のグラフ、連続分布では滑らかな曲線に見えます。例えばサイコロの出目Xは1から6まで等確率です。x=3とするとF(3)=P(X≤3)=3/6=0.5。つまり3以下の目が出る確率は50%ということです。ここで重要なのは、F(x)は「数値xを境にして、それ以下の結果がどれくらい起こるか」を一つの関数としてまとめている点です。

このように、F(x)を読むときは「xを動かすと確率がどう変わるか」を追いかけます。

ポイント: F(x)は0から始まり、xが増えるにつれて非decreasingに、最終的には1に到達します。これが確率の基本的な性質です。

累積分布関数とは何か

累積分布関数は、先ほどの説明と同じF(x)の正式な呼び名です。「累積」という言葉は、ある点までの確率を積み上げた意味で、Xがどんな値をとっても、その値以下になる確率をひとまとめにしたものです。連続分布の場合、PDFを微分すればCDFを得ることができます。例として、コインを投げて「表が出る回数」をXとすると、Xが1回以上である確率などをF(x)を用いて読み替えられます。

連続分布ではF(x)は滑らかな曲線になりますが、離散分布では階段状の形になります。数学的にはF(x)=∫_{-∞}^{x}f(t) dtと表せますが、ここでは直感に合わせて「A点までの確率を足し合わせる」と覚えるのが良いでしょう。

2つの関数の違いを具体例で見てみよう

ここでは分かりやすい例として、サイコロと連続分布を組み合わせて考えます。サイコロの例では、F(1)=P(X≤1)=1/6、F(2)=P(X≤2)=2/6など、xを1,2,3のように変えるごとに階段が一段ずつ上がります。連続分布の例としては、区間[0,1]の一様分布を考えます。f(x)=1 for 0≤x≤1で、F(x)=0 for x<0、F(x)=x for 0≤x≤1、F(x)=1 for x>1となります。この違いを覚えると、PDFとCDFの関係も自然に理解できるようになります。

さらに、現実のデータを見たときに「どちらの関数が必要ですか？」という問いに対しては、確率を積み上げたいときはCDF、密度のような割合を知りたいときはPDFを使う、という実務的な使い分けが身につきます。

このセクションの終わりには、以下の小さな表で、離散と連続の違いを一目で見られるようにしています。

<table> <th>分布の種類CDFの形例離散分布階段状サイコロ連続分布滑らかな曲線一様分布 [0,1] 関係F'(x)=f(x)が成り立つ場合が多いPDFとCDFの関係 table>

ピックアップ解説

今日は累積分布関数についての雑談です。ふとした日常のデータを思い出してほしいのですが、テストの点数やゲームのスコアがどのくらいの割合で“この点以下”に収まるかを考えるとき、私たちは自然とCDFの考え方を使います。CDFは「この点までの確率を足し合わせたもの」と言い換えられ、データの分布の形を一枚の曲線にまとめます。時には、CDFの読み方が難しく感じる場面もありますが、実は日常の確率感覚と直結していて、xを少しずつ動かすだけで“確率がどの方向へ動くか”が見える点がとても楽しいんです。もし友達とデータを比べるとき、CDFを使うと「この点以下の人が多い／少ない」がはっきり分かるので、話し合いがスムーズになります。では次はあなたのデータにもCDFを当てはめて、どんな発見があるか一緒に見てみましょう。

前の記事： « ATVとサイドバイサイドの違いを徹底解説：選び方と使い分けのコツ

次の記事：増加と増量の違いを徹底解説！意味の違いを中学生にもわかる言葉で解説 »