SkypeでR勉強会

id:wakutekaさん主催のSkypeでR勉強会第4回目のメモです。

基本統計関数

準備
> uriage<-c(12,6,13,7,8,11,12,9,10,7)

sum()
#合計
mean()
#平均
max()
#最大値
min()
#最小値

range()
#最小値から最大値までの範囲
#返値は最大値と最小値が返される
	ex.)
	>range(uriage)
	[1]  6 13
	
median()
#中央値

cumsum()
#累積
	ex.)
	> cumsum(uriage)
	 [1] 12 18 31 38 46 57 69 78 88 95

cummax()
#要素時点の最大値を返す
	ex.)
	> cummax(uriage)
	 [1] 12 12 13 13 13 13 13 13 13 13
	
	応用.)
	plot(cumsum(sort(uriage, T))/sum(uriage))
	lines(cumsum(sort(uriage, T))/sum(uriage))
	#比率と割合の関係

cumprod()
#累乗
	ex.)
	> cumprod(1:10)
	 [1]	1	2	6	24	120	720	5040	40320	362880
	[10]	3628800

var()
#分散、共分散行列、相関、相関行列

sd()
#標準偏差

#分散と標準偏差の違い
	#分散は二乗和なので次元が異なる。
	#元のデータと次元をそろえるために標準偏差を用いる。

quantile()
#クォンタイル点を求める。
#データを大きさの順にならべて、データを4等分したとき、各等分の境の値のことを四分位数と呼び、第3四分位数から第1四分位数を引いて2で割ったもののことである。四分位偏差とも呼ぶ。

summary()
#要約統計量
#最小値、第一四分位数、中央値、平均、第三四分位数、最大値を表示

メモ

> .Machine$double.eps
[1] 2.220446e-16

> .Machine
#Rを実行しているマシンで取り扱える最大値を表示する