R 代表値 分散 標準偏差

Rによるやさしい統計学 https://www.amazon.co.jp/dp/4274067106 2章から。

代表値

代表値とは、分布の中心的位置を示す、そのデータを代表する値のこと

勉強する内容

  • 平均値: 分布の中心的位置を示す、そのデータを代表する値
  • sum(): 合計
  • length(): データの個数
  • mean(): 平均
  • 中央値: データを大きさの順に並べた場合、真ん中に位置する値
  • table(): 度数分布
  • 最頻値: 最も頻繁に観測される値。Rには最頻値を求める関数はない。
test_a <- c(10,13,8,15,8)
sum(test_a)
sum(test_a)/length(test_a)
mean(test_a)
table(test_a)
> test_a <- c(10,13,8,15,8)
> sum(test_a)
[1] 54
> sum(test_a)/length(test_a)
[1] 10.8
> mean(test_a)
[1] 10.8
> table(test_a)
test_a
 8 10 13 15 
 2  1  1  1 
> 

平均を数式で表すと

{ \displaystyle
\bar{x} = \frac{x_1 + x_2 + \cdots + x_n}{n}
}

分散 標準偏差

データを x_1,x_2,\cdots ,x_n 、データの平均を \mu としたとき、 分散を式で表すと

{\displaystyle
\mbox{分散} = \frac{(x_1 - \mu) ^2 + (x_2 - \mu) ^2 + \cdots + (x_n - \mu) ^2 }{ n }
}

テキスト通りにやってみる。

test_a <- c(10,13,8,15,8)
test_a_heikin <- mean(test_a)
heikin_karano_hensa <- test_a - test_a_heikin
heikin_karano_hensa
heikin_karano_hensano_nijou <- heikin_karano_hensa^2 
heikin_karano_hensano_nijou
heikin_karano_hensano_nijou_wa <- sum(heikin_karano_hensano_nijou)
heikin_karano_hensano_nijou_wa
data_suu <- length(test_a)
data_suu
bunsan <- heikin_karano_hensano_nijou_wa/data_suu
bunsan 
sqrt(bunsan)

実行結果

> test_a <- c(10,13,8,15,8)
> test_a_heikin <- mean(test_a)
> heikin_karano_hensa <- test_a - test_a_heikin
> heikin_karano_hensa
[1] -0.8  2.2 -2.8  4.2 -2.8
> heikin_karano_hensano_nijou <- heikin_karano_hensa^2 
> heikin_karano_hensano_nijou
[1]  0.64  4.84  7.84 17.64  7.84
> heikin_karano_hensano_nijou_wa <- sum(heikin_karano_hensano_nijou)
> heikin_karano_hensano_nijou_wa
[1] 38.8
> data_suu <- length(test_a)
> data_suu
[1] 5
> bunsan <- heikin_karano_hensano_nijou_wa/data_suu #分散
> bunsan
[1] 7.76
> sqrt(bunsan) #標準偏差
[1] 2.785678