読者です 読者をやめる 読者になる 読者になる

R 相関係数

2つの変数同士の関係について。

データは、『Rによるやさしい統計学https://www.amazon.co.jp/dp/4274067106 3章から。

勉強する内容

  • 共分散の問題点: 大きさが測定単位に依存
  • 相関係数: 共分散を2変数の標準偏差の積で割る
  • cor(): 相関係数
  • 相関係数は共分散の分母がnの時もn-1のときも同じ値になる
  • 相関係数の最大値: 1
  • 相関係数は2変数の相関関係が強いほど絶対値は大きくなる
  • 相関係数の大きさの評価 同書「表3.1」参照

相関係数

相関係数を  {r_{xy}} 、右辺の分子が共分散、分母がそれぞれ変数xとyの標準偏差であるとき

 \displaystyle
r_{xy} = \frac{s_{xy}}{s_x s_y}

と表すことができる。

s_test1 <- c(6,10,6,10,5,3,5,9,3,3,11,6,11,9,7,5,8,7,7,9)
s_test2 <- c(10,13,8,15,8,6,9,10,7,3,18,14,18,11,12,5,7,12,7,7)
p_test1 <- c(13,14,7,12,10,6,8,15,4,14,9,6,10,12,5,12,8,8,12,15)
# 相関係数
cov(s_test1,s_test2) / (sd(s_test1) * sd(s_test2))
# 相関係数 関数を用いた場合
cor(s_test1,s_test2)
cor(p_test1,s_test1)
cor(p_test1,s_test2)

実行結果

> s_test1 <- c(6,10,6,10,5,3,5,9,3,3,11,6,11,9,7,5,8,7,7,9)
> s_test2 <- c(10,13,8,15,8,6,9,10,7,3,18,14,18,11,12,5,7,12,7,7)
> p_test1 <- c(13,14,7,12,10,6,8,15,4,14,9,6,10,12,5,12,8,8,12,15)
> cov(s_test1,s_test2) / (sd(s_test1) * sd(s_test2))
[1] 0.749659
> cor(s_test1,s_test2)
[1] 0.749659
> cor(p_test1,s_test1)
[1] 0.3826645
> cor(p_test1,s_test2)
[1] -0.09350516