R 代表値 分散 標準偏差
Rによるやさしい統計学 https://www.amazon.co.jp/dp/4274067106 2章から。
代表値
代表値とは、分布の中心的位置を示す、そのデータを代表する値のこと
勉強する内容
- 平均値: 分布の中心的位置を示す、そのデータを代表する値
- sum(): 合計
- length(): データの個数
- mean(): 平均
- 中央値: データを大きさの順に並べた場合、真ん中に位置する値
- table(): 度数分布
- 最頻値: 最も頻繁に観測される値。Rには最頻値を求める関数はない。
test_a <- c(10,13,8,15,8) sum(test_a) sum(test_a)/length(test_a) mean(test_a) table(test_a)
> test_a <- c(10,13,8,15,8) > sum(test_a) [1] 54 > sum(test_a)/length(test_a) [1] 10.8 > mean(test_a) [1] 10.8 > table(test_a) test_a 8 10 13 15 2 1 1 1 >
平均を数式で表すと
分散 標準偏差
データを 、データの平均をとしたとき、 分散を式で表すと
テキスト通りにやってみる。
test_a <- c(10,13,8,15,8) test_a_heikin <- mean(test_a) heikin_karano_hensa <- test_a - test_a_heikin heikin_karano_hensa heikin_karano_hensano_nijou <- heikin_karano_hensa^2 heikin_karano_hensano_nijou heikin_karano_hensano_nijou_wa <- sum(heikin_karano_hensano_nijou) heikin_karano_hensano_nijou_wa data_suu <- length(test_a) data_suu bunsan <- heikin_karano_hensano_nijou_wa/data_suu bunsan sqrt(bunsan)
実行結果
> test_a <- c(10,13,8,15,8) > test_a_heikin <- mean(test_a) > heikin_karano_hensa <- test_a - test_a_heikin > heikin_karano_hensa [1] -0.8 2.2 -2.8 4.2 -2.8 > heikin_karano_hensano_nijou <- heikin_karano_hensa^2 > heikin_karano_hensano_nijou [1] 0.64 4.84 7.84 17.64 7.84 > heikin_karano_hensano_nijou_wa <- sum(heikin_karano_hensano_nijou) > heikin_karano_hensano_nijou_wa [1] 38.8 > data_suu <- length(test_a) > data_suu [1] 5 > bunsan <- heikin_karano_hensano_nijou_wa/data_suu #分散 > bunsan [1] 7.76 > sqrt(bunsan) #標準偏差 [1] 2.785678