rとr二乗の違いを徹底解説！相関係数と決定係数の意味と使い方を中学生にもわかりやすく解説

この記事を書いた人

小林聡美

名前：小林聡美（こばやしさとみ）ニックネーム：さと・さとみん年齢：25歳性別：女性職業：季節・暮らし系ブログを運営するブロガー／たまにライター業も受注居住地：東京都杉並区・阿佐ヶ谷の1Kアパート（築15年・駅徒歩7分）出身地：長野県松本市（自然と山に囲まれた町で育つ）身長：158cm 血液型：A型誕生日：1999年5月12日趣味：・カフェで執筆＆読書（特にエッセイと季節の暮らし本）・季節の写真を撮ること（桜・紅葉・初雪など）・和菓子＆お茶めぐり・街歩きと神社巡り・レトロ雑貨収集・Netflixで癒し系ドラマ鑑賞性格：落ち着いていると言われるが、心の中は好奇心旺盛。丁寧でコツコツ型、感性豊か。慎重派だけどやると決めたことはとことん追求するタイプ。ちょっと天然で方向音痴。ひとり時間が好きだが、人の話を聞くのも得意。 1日のタイムスケジュール（平日）：時間行動 6:30 起床。白湯を飲んでストレッチ、ベランダから天気をチェック 7:00 朝ごはん兼SNSチェック（Instagram・Xに季節の写真を投稿することも） 8:00 自宅のデスクでブログ作成・リサーチ開始 10:30 近所のカフェに移動して作業（記事執筆・写真整理） 12:30 昼食。カフェかコンビニおにぎり＋味噌汁 13:00 午後の執筆タイム。主に記事の構成づくりや装飾、アイキャッチ作成など 16:00 夕方の散歩・写真撮影（神社や商店街。季節の風景探し） 17:30 帰宅して軽めの家事（洗濯・夕飯準備） 18:30 晩ごはん＆YouTube or Netflixでリラックス 20:00 投稿記事の最終チェック・予約投稿設定 21:30 読書や日記タイム（今日の出来事や感じたことをメモ） 23:00 就寝前のストレッチ＆アロマ。23:30に就寝

rとr二乗の違いを理解する基本ガイド

この章では、 r と r二乗 の違いを、実際のデータ分析の場面で役立つように分かりやすく解説します。

相関係数 r は、2つの変数がどの程度「直線的に」関係しているかを示す指標です。

値は -1 から 1 の間を取り、正の値は正の方向の関係、負の値は反対方向の関係を意味します。0 に近いほど、直線的な関係は弱い、つまりほとんど関連がないと解釈されます。

一方、r二乗（R^2）は回帰モデルがデータの変動をどれだけ説明できるかの割合を表す指標で、0 から 1 の間の値を取ります。

この二つは似ているようで意味が異なり、使い方も異なります。

例えば r が 0.8 なら、強い正の直線関係があることを意味します。

しかし 0.8 という r の値だけでは「どれくらいの変動が説明されているか」は分かりません。そこで R^2 が役に立つのです。R^2 が 0.64 なら、データの約 64% の変動がモデルによって説明されていると解釈できます。

このように、リレーションの強さとモデルの説明力は別物として考えると混乱を避けられます。

この基礎を押さえた上で、次の章で r と R^2 の実際の使い方や注意点を詳しく見ていきましょう。

続けて、用語や概念の混乱を避けるための「覚え方のコツ」もいくつか紹介します。

この章を読んだ後には、データ分析の現場で r と R^2 の違いをすぐに説明できるようになるはずです。

rとは何か？

r は「相関係数」として知られる統計の基本指標です。

式で書くと r = cov(X,Y) / (sd(X) sd(Y)) となり、X と Y の共分散を、それぞれの標準偏差で割る形になります。

この値は -1 から 1 の範囲をとり、正の値は X が増えると Y も増える傾向、負の値は X が増えると Y が減る傾向を示します。

注意点として、r は「直線的な関係の強さと方向」を表すだけで、非直線的な関係や因果関係を示すものではありません。

データに外れ値があると r の値が大きく振れやすいという性質も覚えておきましょう。

また、サンプルから母集団の r を推定する場合には、統計的検定や p 値、t 値といった概念も登場します。これらは「データのサンプルサイズ n に対して r がどれだけ有意か」を判断するための道具です。

r二乗（R^2）とは何か？

R^2 は「決定係数」とも呼ばれ、回帰モデルがデータの変動をどれだけ説明しているかを示します。

式で表すと、R^2 = 1 - SSE/SST となり、SSE は残差平方和、SST は総変動平方和です。

単純な直線回帰では R^2 は r の二乗、つまり R^2 = r^2 になります。

しかし、複数の説明変数を使う重回帰では必ずしも r^2 = R^2 にはなりません。

R^2 はデータの説明力をある程度の解釈で示してくれますが、過学習やデータの分布、非線形関係を見逃すリスクもあることを理解してください。

「高い R^2＝良いモデル」という短絡的な解釈には注意が必要です。モデルの妥当性を判断するには、残差の分析や交差検証などの追加チェックが欠かせません。

rとR^2の使い分けと実践のコツ

実務では、まず相関の強さと方向を知りたいときには r を使います。散布図を見て、データ点が直線にどの程度近いかを眺めるのが第一歩です。次に、モデルがどれだけデータの変動を説明しているかを知りたいときには R^2 が役立ちます。特に回帰分析を初めて行うときには、R^2 が大きいほど説明力が高いと感じやすいですが、それだけで判断せず、
非線形な関係の可能性、外れ値の有無、データの分布、サンプルサイズ、説明変数の数の増減などを総合的に評価しましょう。

さらに、R^2 が過度に高くなる場合は、モデルの複雑さに対してデータが十分かを検討する必要があります。これには 調整済み R^2 や 交差検証 などのテクニックが便利です。結局のところ、r と R^2 は補完的な指標であり、同時に解釈することで、データが伝えたいストーリーをより正確に描くことができます。

<table>指標意味主な注意点r線形関係の強さと方向外れ値に敏感、因果を示さないR^2説明される変動の割合過学習に注意、非線形には弱い

ピックアップ解説

友達との雑談から生まれたこのテーマ。私と友達の間で、R^2 を“モデルの総合勝ち点”みたいに勘違いしている人がいて、そこから r と R^2 の本質のすれ違いについて会話が始まりました。私が「R^2 は説明力の割合だよ」と言うと、友達は「じゃあ R^2 が高いほどいいモデルなの？」と聞きました。私は「必ずしもそうではない。データの分布や非線形な関係、外れ値の存在を無視してはいけない」と返しました。雑談の中で、データをどのように視覚化し、残差を分析し、適切な検証を行うべきかを実演するデモを見せ、二人で短いデータ分析の演習をしました。誰もが気軽に使える指標だからこそ、正しく使い分けることが大切だと再認識しました。

前の記事： « en規格とiso規格の違いがまるっとわかる最強ガイド｜知っておくべき基礎知識と使い分け

次の記事： CEマークとPSEマークの違いを徹底解説！EUと日本の安全規制を中学生にもわかる言い換え »