R 相関係数
2つの変数同士の関係について。
データは、『Rによるやさしい統計学』 https://www.amazon.co.jp/dp/4274067106 3章から。
勉強する内容
- 共分散の問題点: 大きさが測定単位に依存
- 相関係数: 共分散を2変数の標準偏差の積で割る
- cor(): 相関係数
- 相関係数は共分散の分母がnの時もn-1のときも同じ値になる
- 相関係数の最大値: 1
- 相関係数は2変数の相関関係が強いほど絶対値は大きくなる
- 相関係数の大きさの評価 同書「表3.1」参照
相関係数
相関係数を 、右辺の分子が共分散、分母がそれぞれ変数xとyの標準偏差であるとき
と表すことができる。
s_test1 <- c(6,10,6,10,5,3,5,9,3,3,11,6,11,9,7,5,8,7,7,9) s_test2 <- c(10,13,8,15,8,6,9,10,7,3,18,14,18,11,12,5,7,12,7,7) p_test1 <- c(13,14,7,12,10,6,8,15,4,14,9,6,10,12,5,12,8,8,12,15) # 相関係数 cov(s_test1,s_test2) / (sd(s_test1) * sd(s_test2)) # 相関係数 関数を用いた場合 cor(s_test1,s_test2) cor(p_test1,s_test1) cor(p_test1,s_test2)
実行結果
> s_test1 <- c(6,10,6,10,5,3,5,9,3,3,11,6,11,9,7,5,8,7,7,9) > s_test2 <- c(10,13,8,15,8,6,9,10,7,3,18,14,18,11,12,5,7,12,7,7) > p_test1 <- c(13,14,7,12,10,6,8,15,4,14,9,6,10,12,5,12,8,8,12,15) > cov(s_test1,s_test2) / (sd(s_test1) * sd(s_test2)) [1] 0.749659 > cor(s_test1,s_test2) [1] 0.749659 > cor(p_test1,s_test1) [1] 0.3826645 > cor(p_test1,s_test2) [1] -0.09350516