データの相関

・散布図 例題1例題2
・共分散
・相関係数

散布図


2つのデータ間の関係性を調べるときには散布図を作ってみると便利です.下の表はある月の15日間の気温とアイスクリームの売り上げを表しています.



この表を元にして作った散布図が下の図です。

相関1
ここでは気温をx座標、売上をy座標にとりました.各日付の気温、売り上げを打ち込んでいくと散布図ができます.
完成した図をよく見てみると、気温が高くなると売上もだいたい増えているようです.

片方が増えるともう片方も増えるような関係を正の相関関係といいます.正の相関があるとき,散布図を使うと各点の分布は右上がりの直線に近くなります.逆に,片方が増えるともう片方は減るような関係を負の相関関係といいます.負の相関があるときは,散布図での点の分布は右下がりの直線に近くなります.どちらの傾向も見られないときは相関関係はないと判断します.散布図を調べると,点はばらばらに分布しています.

上の例はどうも気温と売上の間に正の相関がありそうです.ただ,気温が上がったからといって必ずしも売上が増えているわけではありません.例えば,3日目の気温は4日目よりも高いですが,売上は4日目の方が多いです.共分散や相関係数を使うと相関関係の有無や相関の強さを数値で表すことができます.



共分散
xの偏差とyの偏差の積の平均値を共分散という.

共分散1


数学と英語の成績のデータがあるとしましょう.数学の点数が平均よりも高い(低い)とき,英語の点数も平均よりも高い(低い)という傾向(つまり,正の相関)が見られれば,偏差の積は正になり,それらを加えた共分散は正になります.逆に,片方は高いのに,もう片方は低いといった傾向(負の相関)が多く見られれば,偏差の積は負になるので共分散も負になります.

共分散の値が
 のとき→正の相関関係
 のとき→負の相関関係


共分散はどちらの相関があるのかの判断を与えてくれますが,それがどのくらい強いものなのか調べるのは簡単ではありません.相関関係の強弱を(ある程度ですが)測る手段として相関係数があります.



相関係数
共分散をそれぞれのデータの標準偏差の積で割ったものを相関係数という.sxyをxとyの共分散とし,sx,syをそれぞれx,yの標準偏差とする.このとき,相関係数rは

相関係数1-1

となる.また,これを変形して

相関係数1-2

1番目の式は共分散と標準偏差が分かっていればすぐに求められます。
それらが分からないときは2番目の式を使うときが多いようです。
2番目の式は大変面倒な形をしていますが言葉に直すと下の形になります。

相関係数の定義

表を使って偏差の2乗の総和と偏差の積の総和を出し相関係数を求めるというのが基本的な方針になります(例題)。

次に相関係数の特徴について説明します。

(相関係数の特徴)
・相関係数は常に-1以上1以下の値をとる。-1≦r≦1
・相関係数が1に近いほど正の相関が強くなり、-1に近いほど負の相関が強くなる。
・相関が0に近いほど相関は弱い


例題を使って相関係数の求め方を見ていきましょう。



【例題】
下の表を使って数学と英語の間の相関係数を求めなさい。

相関係数-表1



STEP 1  平均値を求める
数学の点数をx、英語の点数をyとします。xとyそれぞれの平均値を求めます。

   



STEP 2  偏差を求める
xとyの偏差を求めて表を埋めましょう。

相関係数-表2



STEP 3  偏差の2乗、偏差の積を求める
偏差の2乗と偏差の積を求めます。このとき、合計も出すようにしましょう。

相関係数-表3



STEP 4  表を利用して相関係数を求める
表よりxの偏差の2乗の和は68、yの偏差の2乗の和は60、偏差の積の和は46であることがわかりました。これらを相関係数の式

相関係数の定義

に代入して相関係数を求めます。

   



スポンサーリンク

コメント
コメントの投稿
管理者にだけ表示を許可する
スポンサーリンク
最新記事
検索フォーム
ランキング