

小林聡美
名前:小林 聡美(こばやし さとみ) ニックネーム:さと・さとみん 年齢:25歳 性別:女性 職業:季節・暮らし系ブログを運営するブロガー/たまにライター業も受注 居住地:東京都杉並区・阿佐ヶ谷の1Kアパート(築15年・駅徒歩7分) 出身地:長野県松本市(自然と山に囲まれた町で育つ) 身長:158cm 血液型:A型 誕生日:1999年5月12日 趣味: ・カフェで執筆&読書(特にエッセイと季節の暮らし本) ・季節の写真を撮ること(桜・紅葉・初雪など) ・和菓子&お茶めぐり ・街歩きと神社巡り ・レトロ雑貨収集 ・Netflixで癒し系ドラマ鑑賞 性格:落ち着いていると言われるが、心の中は好奇心旺盛。丁寧でコツコツ型、感性豊か。慎重派だけどやると決めたことはとことん追求するタイプ。ちょっと天然で方向音痴。ひとり時間が好きだが、人の話を聞くのも得意。 1日のタイムスケジュール(平日): 時間 行動 6:30 起床。白湯を飲んでストレッチ、ベランダから天気をチェック 7:00 朝ごはん兼SNSチェック(Instagram・Xに季節の写真を投稿することも) 8:00 自宅のデスクでブログ作成・リサーチ開始 10:30 近所のカフェに移動して作業(記事執筆・写真整理) 12:30 昼食。カフェかコンビニおにぎり+味噌汁 13:00 午後の執筆タイム。主に記事の構成づくりや装飾、アイキャッチ作成など 16:00 夕方の散歩・写真撮影(神社や商店街。季節の風景探し) 17:30 帰宅して軽めの家事(洗濯・夕飯準備) 18:30 晩ごはん&YouTube or Netflixでリラックス 20:00 投稿記事の最終チェック・予約投稿設定 21:30 読書や日記タイム(今日の出来事や感じたことをメモ) 23:00 就寝前のストレッチ&アロマ。23:30に就寝
確率分布関数と累積分布関数の違いを理解するための基本
この記事では「確率分布関数」と「累積分布関数」という言葉の意味と違いを、中学生にもわかる例と図解を使って丁寧に解説します。まず大事なポイントは、これらの名前が混同されがちですが、実は現場で使われる意味にはズレがないことが多い、ということです。厳密には「累積分布関数」が正式な名称で、ある値以下になる確率を表します。一方、日常的には「確率分布関数」という言葉がCDFの代替として使われることもあります。さらに理解を深めるには「確率密度関数(PDF)」との関係も見るとスッキリします。
この先の説明では、まず離散分布と連続分布の違いを押さえ、そのうえで実際の数値の例を出して、どのように読み解けばよいかを学びます。どうぞゆっくり読み進めてください。
確率分布関数とは何か
確率分布関数は、ある値以下になる確率を表す関数です。Xを「起こりうる結果を表す数値」、xを観測値とすると、F(x)=P(X≤x)となります。離散分布では階段状のグラフ、連続分布では滑らかな曲線に見えます。例えばサイコロの出目Xは1から6まで等確率です。x=3とするとF(3)=P(X≤3)=3/6=0.5。つまり3以下の目が出る確率は50%ということです。ここで重要なのは、F(x)は「数値xを境にして、それ以下の結果がどれくらい起こるか」を一つの関数としてまとめている点です。
このように、F(x)を読むときは「xを動かすと確率がどう変わるか」を追いかけます。
ポイント: F(x)は0から始まり、xが増えるにつれて非decreasingに、最終的には1に到達します。これが確率の基本的な性質です。
累積分布関数とは何か
累積分布関数は、先ほどの説明と同じF(x)の正式な呼び名です。「累積」という言葉は、ある点までの確率を積み上げた意味で、Xがどんな値をとっても、その値以下になる確率をひとまとめにしたものです。連続分布の場合、PDFを微分すればCDFを得ることができます。例として、コインを投げて「表が出る回数」をXとすると、Xが1回以上である確率などをF(x)を用いて読み替えられます。
連続分布ではF(x)は滑らかな曲線になりますが、離散分布では階段状の形になります。数学的にはF(x)=∫_{-∞}^{x}f(t) dtと表せますが、ここでは直感に合わせて「A点までの確率を足し合わせる」と覚えるのが良いでしょう。
2つの関数の違いを具体例で見てみよう
ここでは分かりやすい例として、サイコロと連続分布を組み合わせて考えます。サイコロの例では、F(1)=P(X≤1)=1/6、F(2)=P(X≤2)=2/6など、xを1,2,3のように変えるごとに階段が一段ずつ上がります。連続分布の例としては、区間[0,1]の一様分布を考えます。f(x)=1 for 0≤x≤1で、F(x)=0 for x<0、F(x)=x for 0≤x≤1、F(x)=1 for x>1となります。この違いを覚えると、PDFとCDFの関係も自然に理解できるようになります。
さらに、現実のデータを見たときに「どちらの関数が必要ですか?」という問いに対しては、確率を積み上げたいときはCDF、密度のような割合を知りたいときはPDFを使う、という実務的な使い分けが身につきます。
このセクションの終わりには、以下の小さな表で、離散と連続の違いを一目で見られるようにしています。
今日は累積分布関数についての雑談です。ふとした日常のデータを思い出してほしいのですが、テストの点数やゲームのスコアがどのくらいの割合で“この点以下”に収まるかを考えるとき、私たちは自然とCDFの考え方を使います。CDFは「この点までの確率を足し合わせたもの」と言い換えられ、データの分布の形を一枚の曲線にまとめます。時には、CDFの読み方が難しく感じる場面もありますが、実は日常の確率感覚と直結していて、xを少しずつ動かすだけで“確率がどの方向へ動くか”が見える点がとても楽しいんです。もし友達とデータを比べるとき、CDFを使うと「この点以下の人が多い/少ない」がはっきり分かるので、話し合いがスムーズになります。では次はあなたのデータにもCDFを当てはめて、どんな発見があるか一緒に見てみましょう。
前の記事: « ATVとサイドバイサイドの違いを徹底解説:選び方と使い分けのコツ



















