確率分布関数と確率密度関数の違いを中学生にも分かる図解で徹底解説！

この記事を書いた人

小林聡美

名前：小林聡美（こばやしさとみ）ニックネーム：さと・さとみん年齢：25歳性別：女性職業：季節・暮らし系ブログを運営するブロガー／たまにライター業も受注居住地：東京都杉並区・阿佐ヶ谷の1Kアパート（築15年・駅徒歩7分）出身地：長野県松本市（自然と山に囲まれた町で育つ）身長：158cm 血液型：A型誕生日：1999年5月12日趣味：・カフェで執筆＆読書（特にエッセイと季節の暮らし本）・季節の写真を撮ること（桜・紅葉・初雪など）・和菓子＆お茶めぐり・街歩きと神社巡り・レトロ雑貨収集・Netflixで癒し系ドラマ鑑賞性格：落ち着いていると言われるが、心の中は好奇心旺盛。丁寧でコツコツ型、感性豊か。慎重派だけどやると決めたことはとことん追求するタイプ。ちょっと天然で方向音痴。ひとり時間が好きだが、人の話を聞くのも得意。 1日のタイムスケジュール（平日）：時間行動 6:30 起床。白湯を飲んでストレッチ、ベランダから天気をチェック 7:00 朝ごはん兼SNSチェック（Instagram・Xに季節の写真を投稿することも） 8:00 自宅のデスクでブログ作成・リサーチ開始 10:30 近所のカフェに移動して作業（記事執筆・写真整理） 12:30 昼食。カフェかコンビニおにぎり＋味噌汁 13:00 午後の執筆タイム。主に記事の構成づくりや装飾、アイキャッチ作成など 16:00 夕方の散歩・写真撮影（神社や商店街。季節の風景探し） 17:30 帰宅して軽めの家事（洗濯・夕飯準備） 18:30 晩ごはん＆YouTube or Netflixでリラックス 20:00 投稿記事の最終チェック・予約投稿設定 21:30 読書や日記タイム（今日の出来事や感じたことをメモ） 23:00 就寝前のストレッチ＆アロマ。23:30に就寝

はじめに：確率分布関数と確率密度関数の基本

ここでは、確率分布関数と確率密度関数の基本を丁寧に解説します。確率分布関数 F(x) は X が x 以下になる確率を表すもので、離散的な場合も連続的な場合も共通の考え方です。

ただし、離散的な場合と連続的な場合では、同じ F(x) でも計算のやり方や意味合いが少し違います。

重要な点として、確率分布関数は常に非降順、つまり x が大きくなると F(x) は必ず増えるか、少なくとも変わらず、0 から 1 の間の値をとる性を持っています。

この性質は、確率の総和が 1 になることと直結します。F(-∞)=0、F(∞)=1 を満たす境界条件も覚えておきましょう。

一方、確率密度関数 f(x) は「ある点 x の周りで X がどれだけの割合で現れそうか」を表す曲線で、面積が確率になるという直感を与えてくれます。

この関数は微分積分と深く関係しており、F(x) は f(x) の不定積分（積分）として表されます。

正しく捉えるためには、まず F(x) と f(x) の意味の違いを混同せずに分けて考えることが大切です。F(x) は「確率そのもの」を扱い、f(x) は「確率がどれくらいの密度で分布しているか」を扱います。つまり F(x) は単位を持つことが多く、f(x) は単位が x の単位あたりの density になります。連続分布の場合、f(x) の下の面積が確率になるという直感は、私たちが日常でよく使う長さや面積の考え方に近いです。

さらに、データを実際に扱う場面を思い浮かべてみましょう。統計の現場では、まずデータをヒストグラムや密度推定で可視化します。そこから F(x) を作ると、ある値以下になる確率をすぐに確認できます。一方、f(x) を作ると、どの値の周りにデータが集まりやすいのか、分布の形が見えてきます。つまり F(x) は「どれくらいの量の確率が積み上がっているか」、f(x) は「どこにどれくらいの密度があるか」を教えてくれるのです。

「確率分布関数」と「確率密度関数」の違いを具体的に理解する

それぞれの関数の違いを、数式と日常のイメージで見ていきましょう。

・確率分布関数 F(x) は「X が x 以下になる確率」を示します。例えば X がある整数のとき、P(X ≤ 3) などの表現です。

・確率密度関数 f(x) は「X がどの値の周りにどれだけの密度を持つか」を表します。

たとえば連続的な値を取る場合、P(a ≤ X ≤ b) は F(b) − F(a) で計算しますが、直接 P(X = x) を定義することはできません。代わりに P(a ≤ X ≤ b) は f(x) の下の曲線と区間の「面積」で表現します。

この点が大きな違いです。PDF は密度を表す関数、CDF は確率を表す関数、この関係を理解することが理解の第一歩です。

実生活の例として、身長のように連続的な値をとる場合、身長が 170 cm 近くになる確率を知りたいときには面積を使います。一方、コインのように離散的な結果しかない場合は、CDF の形を使って「ある値以下になる確率」を数え上げる感覚になります。

このように、両者は異なる目的と対象を持つが、密接に結びついた関係にあるのです。

具体例と表で見る違い

ここでは具体例を二つ挙げて、CDF と PDF の意味の違いを直感的に整理します。

例1：サイコロの目を X とします。X は離散変数で、P(X ≤ 4) は F(4) で表されます。離散の場合、F(x) は階段状の曲線になり、x が 4 以下になる全ての点の和が確率になります。

例2：身長の分布を考えるとします。X は連続変数で、f(x) は身長の分布の密度です。P(165 cm ≤ X ≤ 170 cm) は F(170) − F(165) で得られ、これを数式的に表すと積分 ∫165^170 f(x) dx となります。

さらに、実務の場面では以下のような使い分けが一般的です。

・データの分布を可視化する時には PDF やヒストグラムを作成して、どの値にどれだけの密度が集まっているかを直感的に把握します。

・データの確率を計算したい時には F(x) を使って特定の値以下の確率を求めます。

このように、目的に応じて関数を使い分けることが重要です。

日常の理解を深めるコツ

最初は混乱して当然です。CDF は「確率の総和のようなもの」、PDF は「密度の曲線」と覚えるとよいでしょう。

例えば、雨粒が降る量をイメージすると、PDF は地面に落ちる雨粒の濃さの分布、CDF はある時間に降った雨の総量の割合を示すと考えると感覚がつかみやすいです。

統計の世界では、これらの概念を混同すると計算ミスにつながりますので、定義をきちんと区別する癖をつけることが大切です。

最後に、式の理解だけでなく、実データに当てはめて F(x) と f(x) を計算してみると、実感が湧いてきます。解釈を厳密に行いながら、練習問題をこなしていきましょう。

表で整理する特徴の違いと応用のヒント

この節では、CDF と PDF の違いを表の形で見やすく整理します。まずは直感的な理解を深め、次に問題解法での使い方を押さえましょう。

<table> head> 特徴確率分布関数 F(x)確率密度関数 f(x) thead> 意味X が x 以下になる確率を表すX の密度を表す（単位は x の単位あたり）値の範囲・性質0 から 1、単調非減少実数全体を取り得る（全体の積分は 1）関係F'(x) = f(x)（条件付き）F(x) は f(x) の不定積分確率の計算方法区間の確率は F(b) − F(a) で算出区間の確率は ∫ f(x) dx で算出分布のイメージ離散的なら階段状、連続的には滑らかな曲線に近い連続的な分布の密度を表す曲線 table>

この表から、確率分布関数は確率そのものの累積を表すのに対し、確率密度関数は分布の形を表す密度の曲線であることが分かります。

実務では、特定の値以下の確率を知りたい時は F(x) を使い、データの分布の形を理解したい場合は f(x) の形状を見ます。

両方を組み合わせて活用することで、データの特徴を正確に読み解く力が身につきます。

ピックアップ解説

今日は確率分布関数と確率密度関数の違いを雑談風に掘り下げました。PDF は密度の曲線であり、単位の話も含めて理解するのが大切です。例えば身長の分布を考えると、密度の山の部分が多いときにその周辺の値がデータの中心付近に集まっているとわかります。CDF はそれら密度を積み上げていくことで、ある時点までの確率を表します。日常の生活にたとえると、雨の降り方のように、どこでどれくらい雨粒が集まるかを考えるのがイメージしやすいです。学習を進めると、F(x) と f(x) の境界がはっきり見えてきて、問題を解くときの自信にもつながります。

前の記事： « 連続変数と離散変数の違いを徹底解説！中学生にも分かる実例と見分け方

次の記事：クラスカルウォリス検定とフリードマン検定の違いを徹底解説｜中学生にもわかる使い分けガイド »