確率質量関数と累積分布関数の違いを徹底解説!中学生にもわかる実践ガイド

  • このエントリーをはてなブックマークに追加
確率質量関数と累積分布関数の違いを徹底解説!中学生にもわかる実践ガイド
この記事を書いた人

小林聡美

名前:小林 聡美(こばやし さとみ) ニックネーム:さと・さとみん 年齢:25歳 性別:女性 職業:季節・暮らし系ブログを運営するブロガー/たまにライター業も受注 居住地:東京都杉並区・阿佐ヶ谷の1Kアパート(築15年・駅徒歩7分) 出身地:長野県松本市(自然と山に囲まれた町で育つ) 身長:158cm 血液型:A型 誕生日:1999年5月12日 趣味: ・カフェで執筆&読書(特にエッセイと季節の暮らし本) ・季節の写真を撮ること(桜・紅葉・初雪など) ・和菓子&お茶めぐり ・街歩きと神社巡り ・レトロ雑貨収集 ・Netflixで癒し系ドラマ鑑賞 性格:落ち着いていると言われるが、心の中は好奇心旺盛。丁寧でコツコツ型、感性豊か。慎重派だけどやると決めたことはとことん追求するタイプ。ちょっと天然で方向音痴。ひとり時間が好きだが、人の話を聞くのも得意。 1日のタイムスケジュール(平日): 時間 行動 6:30 起床。白湯を飲んでストレッチ、ベランダから天気をチェック 7:00 朝ごはん兼SNSチェック(Instagram・Xに季節の写真を投稿することも) 8:00 自宅のデスクでブログ作成・リサーチ開始 10:30 近所のカフェに移動して作業(記事執筆・写真整理) 12:30 昼食。カフェかコンビニおにぎり+味噌汁 13:00 午後の執筆タイム。主に記事の構成づくりや装飾、アイキャッチ作成など 16:00 夕方の散歩・写真撮影(神社や商店街。季節の風景探し) 17:30 帰宅して軽めの家事(洗濯・夕飯準備) 18:30 晩ごはん&YouTube or Netflixでリラックス 20:00 投稿記事の最終チェック・予約投稿設定 21:30 読書や日記タイム(今日の出来事や感じたことをメモ) 23:00 就寝前のストレッチ&アロマ。23:30に就寝


確率質量関数と累積分布関数の基本を押さえる

まずは【確率質量関数】と【累積分布関数】の両方が何を指しているのかを区別しておくことが大切です。

確率質量関数は離散的なデータの分布を表す指標で、Xがとる各値ごとにその値が起こる確率を示します。

一方、累積分布関数はある値以下になる確率を集めたもので、連続・離散のどちらにも適用できますが、離散型のときはF(x)=P(X≤x)としてx以下の全ての点を足し合わせて求めます。この二つは密接に関係しており、PMFとCDFは互いに補完し合う存在です。

実務や学習の現場では、条件付き確率や期待値を求めるときにもこの二つの考え方が基本の道具になります。

学習のコツは、最初に用語の意味をはっきりさせ、次に具体例で感覚をつかみ、最後に表や図で整理することです。

定義と関係性

確率質量関数と累積分布関数の定義を正しく押さえると、ややこしい混乱を避けられます。

まず確率質量関数 PMFはXがとる値kに対し

p(k)=P(X=k)

と定義されます。離散的なXの取り得る値ごとにこの確率が決まります。

次に累積分布関数 CDFはF(x)=P(X≤x)と定義され、xが整数でも小数でも扱えます。

重要な関係として、離散の場合はそして

p(k)=F(k)−F(k−1)

となります。つまりCDFはPMFを積み重ねて得られる値であり、PMFはCDFの“差分”として現れます。

この関係を意識するだけで、問題の解法の道筋が見えやすくなります。

また、サポートとはp(k)>0となる値の集合を指し、ここがPMFの対象となる点の意味を持ちます。

実務ではこの考えを用いて、特定の値以下の確率や中央値付近の確率をすばやく見積もります。

実例と表での比較

ここからは具体的な例を使って、PMFとCDFの違いを直感的に理解します。

6面サイコロを一回振るケースを考えましょう。サイコロの出る目は1,2,3,4,5,6の6通りで、どの目も同じく確率は1/6です。

このときPMFはp(1)=p(2)=p(3)=p(4)=p(5)=p(6)=1/6となり、それ以外の値の確率は0です。

一方CDFはXがある値以下になる確率を示します。F(1)=1/6、F(2)=2/6、F(3)=3/6、F(4)=4/6、F(5)=5/6、F(6)=1となります。

このように、PMFは「々の値の確率」を、CDFは「ある値以下になる確率」を表すのです。

以下の表はこの考え方を整理したものです。

表は実務の場面での理解を助けますので参考にしてください。

<table>性質確率質量関数(PMF)累積分布関数(CDF)定義Xがとる値kの確率 p(k)=P(X=k)Xがある値x以下になる確率 F(x)=P(X≤x)値の対象整数など离散な値整数・実数どちらも対象関係p(k)=F(k)−F(k−1)F(k)=∑_{i≤k} p(i)例サイコロの出目の確率出目が1以下になる確率などの総和

このように表と関係を押さえると、問題文に現れる「この値以下になる確率はどれくらい」という質問にすぐ対応できます。

実務ではデータが離散か連続かで使い分けますが、基本はこの二つの関係性を思い出すことです。

最後にもう少しだけ応用の話をします。

例えば期待値や分散をPMFから求めるときにはp(k)を、CDFからはF(x)を使います。いずれの道具も、データの分布を頭の中に正確に描くための“設計図”として役立ちます。

ピックアップ解説

友だちと雑談しているようなリアルな雰囲気で深掘りします。
確率質量関数はあくまでも“点の確率”をきちんと教えてくれる道具で、累積分布関数はその点の連続的な積み重ねを示す地図のようなものだと考えると理解が進みます。
私はPMFとCDFを往復する練習をするとき、まずはp(k)を決めてから, そしてもう一度

p(k)=F(k)−F(k−1)

を確かめる流れをつくります。
例えばサイコロの例では、p(3)=1/6であることを確認した後、F(3)=3/6とF(2)=2/6の差がちょうど1/6になることを自分の手で計算してみるのがコツです。
こうすることで「確率の分布がどうつながっているのか」が体感的に理解できます。
さらに難しい応用として、離散的なデータを扱うときCDFのグラフを描くと、中央値や分布の形が視覚的に見えやすくなります。
結局のところ、PMFとCDFは二つの視点を切り替える窓口であり、どちらを使うかはその問い方次第ということです。


の人気記事

会所桝と集水桝の違いを徹底解説|用途と設置場所をわかりやすく
737viws
ラフタークレーンとラフテレーンクレーンの違いを徹底解説!現場で役立つ選び方と使い分けのコツ
508viws
c-2とc-1の違いを完全解説!下地調整材の選び方と使い分け
473viws
意見聴収と意見聴取の違いを完全マスター:場面別の使い分けと注意点を中学生にもわかる言葉で解説
457viws
dBとdB(A)の違いを徹底解説!音のデシベルを正しく使い分ける入門ガイド
450viws
COAと試験成績書の違いを徹底解説!どちらをいつ確認すべき?
441viws
ゲート弁とスルース弁の違いをわかりやすく解説!現場で使い分けるためのポイント
437viws
圧着端子と圧縮端子の違いを徹底解説|使い分けのコツと選び方を中学生にもわかる解説
424viws
ベニヤとラワンの違いを徹底比較!初心者にもわかる素材選びガイド
424viws
A4サイズとB5サイズの違いを徹底解説!用途別の選び方と実務で役立つ使い分けガイド
397viws
消石灰と生石灰の違いを完全解説!誰でもわかる使い分けと安全ポイント
390viws
凍結防止剤と融雪剤の違いを徹底解説:名前が似ても役割が違う理由を中学生にもわかりやすく
389viws
フランジとルーズフランジの違いを徹底解説|基本から使い分けのコツまで
354viws
中心線測量と縦断測量の違いを徹底解説!地図づくりの基本を押さえる
352viws
ハット型と鋼矢板の違いを徹底解説!現場で使える選び方ガイド
348viws
SDSとTDSの違いを徹底解説!役立つ使い分けと実務ポイントを中学生にもわかる解説
347viws
ドラグショベルとパワーショベルの違いを徹底解説!現場での使い分けと選び方のコツ
343viws
ジップロックとジップロップの違いを徹底解説!正しい呼び名と使い方を知ろう
342viws
CPKとPPKの違いを完全解説!意味と用途を中学生にも分かりやすく比較
326viws
小型移動式クレーンと移動式クレーンの違いを徹底解説|現場で役立つ選び方と使い方
321viws

新着記事

の関連記事