

小林聡美
名前:小林 聡美(こばやし さとみ) ニックネーム:さと・さとみん 年齢:25歳 性別:女性 職業:季節・暮らし系ブログを運営するブロガー/たまにライター業も受注 居住地:東京都杉並区・阿佐ヶ谷の1Kアパート(築15年・駅徒歩7分) 出身地:長野県松本市(自然と山に囲まれた町で育つ) 身長:158cm 血液型:A型 誕生日:1999年5月12日 趣味: ・カフェで執筆&読書(特にエッセイと季節の暮らし本) ・季節の写真を撮ること(桜・紅葉・初雪など) ・和菓子&お茶めぐり ・街歩きと神社巡り ・レトロ雑貨収集 ・Netflixで癒し系ドラマ鑑賞 性格:落ち着いていると言われるが、心の中は好奇心旺盛。丁寧でコツコツ型、感性豊か。慎重派だけどやると決めたことはとことん追求するタイプ。ちょっと天然で方向音痴。ひとり時間が好きだが、人の話を聞くのも得意。 1日のタイムスケジュール(平日): 時間 行動 6:30 起床。白湯を飲んでストレッチ、ベランダから天気をチェック 7:00 朝ごはん兼SNSチェック(Instagram・Xに季節の写真を投稿することも) 8:00 自宅のデスクでブログ作成・リサーチ開始 10:30 近所のカフェに移動して作業(記事執筆・写真整理) 12:30 昼食。カフェかコンビニおにぎり+味噌汁 13:00 午後の執筆タイム。主に記事の構成づくりや装飾、アイキャッチ作成など 16:00 夕方の散歩・写真撮影(神社や商店街。季節の風景探し) 17:30 帰宅して軽めの家事(洗濯・夕飯準備) 18:30 晩ごはん&YouTube or Netflixでリラックス 20:00 投稿記事の最終チェック・予約投稿設定 21:30 読書や日記タイム(今日の出来事や感じたことをメモ) 23:00 就寝前のストレッチ&アロマ。23:30に就寝
zスコアと標準化の基本を押さえる
データを他のデータと比べやすくする方法にはいろいろありますが、基本的には「位置」と「広がり」をそろえることが大事です。ここで登場するのが zスコア と 標準化 です。まずは用語の基本を押さえましょう。
まずは用語の意味をざっくり伝えると、zスコア とは、ある値 x が母集団の平均 μ からどれくらい離れているかを、母集団のばらつきの度合いで割って作る数値です。式は z = (x - μ) / σ。これを使えば、元のデータの単位や尺度が違っても「同じ感覚」で比較できます。つまり、1点の意味を別のテストの点数と比べることが容易になるのです。
一方、標準化 という言葉は、データの尺度をそろえるための広い概念です。標準化 には zスコア標準化 だけでなく、最小値を0・最大値を1にそろえる 正規化(min-max normalization) など、さまざまな方法が含まれます。つまり「標準化」は目的に合わせた前処理の総称であり、中身は状況次第で変わります。これを押さえておくと、データ分析の場面で適切な手法を選びやすくなります。
具体的なイメージをつかむための小さな例を見てみましょう。あるテストの点数が 45、55、70、95 という4点だったとします。平均 μ は約66.25、標準偏差 σ は約22.9です。各点の zスコアは 45 → (45-66.25)/22.9 ≈ -0.95、55 → -0.50、70 → 0.16、95 → 1.27 となります。これにより、各点が平均からどの程度「高い・低い」かを直感的に捉えやすくなります。
このように zスコア は「中心と広がり」を同じ土俵で評価したい場合に強力な道具であり、標準化 の一形態として使われるのが一般的です。
zスコアと標準化の違いを実務で使い分けるポイント
実務ではデータの用途に合わせて使い分けることが大切です。機械学習の前処理でよく使われるのは zスコア標準化 ですが、データを機械が扱いやすい形にそろえるには 0-1 に正規化 など他の方法が適していることもあります。
たとえば、複数の特徴量の規模が大きく異なる場合、モデルが大きな数値に引っ張られてしまうのを防ぐために 標準化 を選ぶことが多いです。一方で、ニューラルネットワークのような特定のアルゴリズムでは 正規化 の方が学習を安定させることがあります。
もう一つの視点は「分布の形」です。 zスコア は元の分布が近似正規分布に近いときに解釈がしやすい反面、歪んだ分布では意味づけが難しくなることもあります。
このように、状況に応じて zスコア、標準化、正規化 を使い分けることが成功の鍵です。
今日は zスコア についての話題を少しだけ深掘りします。友だちとデータの話をしていて、あるテストの点数が偏っていると気づいた瞬間、zスコア がどういう役割を果たすかに気づいたんです。分布の形が正規分布に近い場合、zスコアの解釈は直感的ですが、歪んだ分布だとどうなるのか、実は注意が必要。そこで考えるのは「標準化」自体の意味です。数値を合わせるのは手順の問題であって、結局は“比較可能にする”ことが目的だよね、という結論にたどり着きます。
次の記事: 直線性と精度の違いを徹底解説!中学生にもわかる3つのポイント »



















