R 代表値分散標準偏差 - momozuka’s blog

Rによるやさしい統計学 https://www.amazon.co.jp/dp/4274067106 2章から。

代表値

代表値とは、分布の中心的位置を示す、そのデータを代表する値のこと

勉強する内容

平均値: 分布の中心的位置を示す、そのデータを代表する値
sum(): 合計
length(): データの個数
mean(): 平均
中央値: データを大きさの順に並べた場合、真ん中に位置する値
table(): 度数分布
最頻値: 最も頻繁に観測される値。Rには最頻値を求める関数はない。

test_a <- c(10,13,8,15,8)
sum(test_a)
sum(test_a)/length(test_a)
mean(test_a)
table(test_a)

> test_a <- c(10,13,8,15,8)
> sum(test_a)
[1] 54
> sum(test_a)/length(test_a)
[1] 10.8
> mean(test_a)
[1] 10.8
> table(test_a)
test_a
 8 10 13 15 
 2  1  1  1 
>

平均を数式で表すと

${ \displaystyle \bar{x} = \frac{x_1 + x_2 + \cdots + x_n}{n} }$

分散標準偏差

データを $x_1,x_2,\cdots ,x_n$ 、データの平均を $\mu$ としたとき、分散を式で表すと

${\displaystyle \mbox{分散} = \frac{(x_1 - \mu) ^2 + (x_2 - \mu) ^2 + \cdots + (x_n - \mu) ^2 }{ n } }$

テキスト通りにやってみる。

sqrt(): 平方根
標準偏差: 分散の平方根

test_a <- c(10,13,8,15,8)
test_a_heikin <- mean(test_a)
heikin_karano_hensa <- test_a - test_a_heikin
heikin_karano_hensa
heikin_karano_hensano_nijou <- heikin_karano_hensa^2 
heikin_karano_hensano_nijou
heikin_karano_hensano_nijou_wa <- sum(heikin_karano_hensano_nijou)
heikin_karano_hensano_nijou_wa
data_suu <- length(test_a)
data_suu
bunsan <- heikin_karano_hensano_nijou_wa/data_suu
bunsan 
sqrt(bunsan)

実行結果

> test_a <- c(10,13,8,15,8)
> test_a_heikin <- mean(test_a)
> heikin_karano_hensa <- test_a - test_a_heikin
> heikin_karano_hensa
[1] -0.8  2.2 -2.8  4.2 -2.8
> heikin_karano_hensano_nijou <- heikin_karano_hensa^2 
> heikin_karano_hensano_nijou
[1]  0.64  4.84  7.84 17.64  7.84
> heikin_karano_hensano_nijou_wa <- sum(heikin_karano_hensano_nijou)
> heikin_karano_hensano_nijou_wa
[1] 38.8
> data_suu <- length(test_a)
> data_suu
[1] 5
> bunsan <- heikin_karano_hensano_nijou_wa/data_suu #分散
> bunsan
[1] 7.76
> sqrt(bunsan) #標準偏差
[1] 2.785678

代表値

勉強する内容

分散 標準偏差

分散標準偏差