【暗記しない数学】相関係数を内積と同じように考えるとかなり分かりやすい件

f:id:McG:20170925134042p

高校生の数学では,確率統計の範囲で相関係数というものを習います.

そして同じく,高校数学のベクトルの範囲で,内積というものを習いました.

全く関連性が無いかのように思えるこの2つですが,実は式の形は全く同じなんですね.

ちょっとだけ数学が楽しくなるお話です.

内積ってなんだっけ?

軽く内積の復習をしておきましょう.

f:id:McG:20170919111434p:plain

『内積を求めよ』と言われると,『2つのベクトルの絶対値を2つのベクトルがなす角を使って求める方法』と,『2つのベクトルの成分を使って求める方法』の2種類がありました.

内積を使った典型的な問題に,以下のような2つのベクトルのなす角を求めるものがあります.

f:id:McG:20170919114629p:plain

上記のような手順によって,例題で示された2つのベクトルのなす角は45度と求めることが出来ました.

さて,例題で使ったベクトルを実際に図示してみると,当たり前ですが45度の角度をなしていることがわかります.

f:id:McG:20170919120538p:plain

これを,言い換えると,2つのベクトルが同じ向きを向いている時には角度が0度,真逆を向いている時は角度が180度となるわけですね

また,2つのベクトル間の角度を \thetaとすると cos\thetaの値は,ベクトルが同じ向きを向いている時に1,真逆を向いている時に-1になっています.

f:id:McG:20170919135731p:plain

『同じ方向を向いていたら1で,真逆を向いている時-1』これによく似たものが統計学でありましたよね?

そう,相関係数です.

f:id:McG:20170919144025p:plain

相関係数の式

高校で習った相関係数,こちらも簡単な具体例でみていきましょう.

3人の英語の点数と数学の点数が以下であった時の英語と数学の相関係数を求めてみます.(本来はもっとデータ数を増やすべきですがわかりやすいように3つでやります)

f:id:McG:20170925103406p:plain

それぞれの点数から,平均点を引いたものを偏差と呼ぶのでした.

今回,Aくんの英語の点数は40点で英語の平均点が70点なので,偏差は 40-70=-30となります.

以下の表の黄色のセルに,偏差をそれぞれ書いておきました.

f:id:McG:20170925104202p:plain

偏差を2乗したものの平均値を分散と呼び,分散のルートを取ったものを標準偏差と呼びます.

ということで,偏差の2乗を計算したものを緑のセルに,分散を赤のセルに書いてみましょう.

f:id:McG:20170925104728p:plain

英語の分散が600,数学の分散が200とわかったので,それぞれのルートを取ることで標準偏差を求めます.

英語の標準偏差は, \sqrt 600 = 24.5,数学の標準偏差は  \sqrt 200 = 14.1と求まりました

もう一つ必要なのが共分散.これは英語の偏差と数学の偏差の積の平均値です.

f:id:McG:20170925111112p:plain

このようにして標準偏差と共分散を求めたら,相関係数を求めるのは簡単です.

f:id:McG:20170925173202p:plain

さて,一応相関係数を求められたところで,内積と相関係数が同じであるということを見ていきましょう.

式を書き直す

さて,先ほど例題で求めた相関係数の式を書き直してみましょう.

f:id:McG:20170925120530p:plain

この相関係数の式,よく見ると1/3で約分することが出来ますね.

するとなんと,英語と数学それぞれの偏差を1つのベクトルとして見た時に『分子が内積』,『分母がそれぞれのベクトルの大きさ』を示していることがわかります

f:id:McG:20170925132531p:plain

相関係数を求める問題と,内積を使ってcosθを求める問題を横に並べてみると更にわかりやすくなるはず.

f:id:McG:20170925134042p:plain

『相関係数は各データの偏差をベクトルとしてみた時のcosθのこと』ということに納得していただけたでしょうか?

何が嬉しいの?

相関係数がcosθであると理解できれば,相関係数の様々な性質を直観的に理解できます.

  1. 相関係数は-1〜1の値を取る→cosθなのだから当たり前
  2. 相関係数が2倍になるからと言って,相関の強さが2倍なのではない→cosθが2倍になっても角度が2倍になるわけではない
  3. 相関係数が1の時は強い相関がある→cosθが1の時,同じ向きのベクトルなので相関が強い

このように,イマイチ理解しにくかった相関係数をベクトルのイメージを使ってスッと理解できるのではないでしょうか?

おまけ

最後におまけです.『偏差はなぜ平均値を引いているのか』について.

相関係数を求める手順の一つ目で,英語,数学のそれぞれの点数から平均値を引くことで偏差を求めていました.

『平均値を引く』という作業は,『原点に平均を持ってくるように平行移動した』と解釈できます

f:id:McG:20170925141415p:plain

英語と数学の点数をプロットした以下の図を見てもらえれば分かるように,平均値を引くことで平均値を原点にもっていっています.

f:id:McG:20170925142950p:plain

『データを平行移動し,原点を平均値にしたあとで,cosθを計算する』というイメージですね.

最後に

今回,相関係数とベクトルの内積という一見するとなにも関係がなさそうなものを紐付けて考えてみました.

ちょっと見方を変えてみると意外なところがつながっていたり,代数を幾何的に考えてみると新しい発見があったりするのが数学の面白いところですよね.

当ブログでは他にも面白い数学ネタを沢山提供しているので,よかったらみていってください!

最後までお読み頂き,ありがとうございました.

© 2016 Yuki Sako.