SkypeでR勉強会
id:wakutekaさん主催のSkypeでR勉強会第4回目のメモです。
基本統計関数
準備 > uriage<-c(12,6,13,7,8,11,12,9,10,7) sum() #合計 mean() #平均 max() #最大値 min() #最小値 range() #最小値から最大値までの範囲 #返値は最大値と最小値が返される ex.) >range(uriage) [1] 6 13 median() #中央値 cumsum() #累積 ex.) > cumsum(uriage) [1] 12 18 31 38 46 57 69 78 88 95 cummax() #要素時点の最大値を返す ex.) > cummax(uriage) [1] 12 12 13 13 13 13 13 13 13 13 応用.) plot(cumsum(sort(uriage, T))/sum(uriage)) lines(cumsum(sort(uriage, T))/sum(uriage)) #比率と割合の関係 cumprod() #累乗 ex.) > cumprod(1:10) [1] 1 2 6 24 120 720 5040 40320 362880 [10] 3628800 var() #分散、共分散行列、相関、相関行列 sd() #標準偏差 #分散と標準偏差の違い #分散は二乗和なので次元が異なる。 #元のデータと次元をそろえるために標準偏差を用いる。 quantile() #クォンタイル点を求める。 #データを大きさの順にならべて、データを4等分したとき、各等分の境の値のことを四分位数と呼び、第3四分位数から第1四分位数を引いて2で割ったもののことである。四分位偏差とも呼ぶ。 summary() #要約統計量 #最小値、第一四分位数、中央値、平均、第三四分位数、最大値を表示
メモ
> .Machine$double.eps [1] 2.220446e-16 > .Machine #Rを実行しているマシンで取り扱える最大値を表示する