スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

$\chi^2$分布, t分布, F分布

$\chi^2$分布とは:

標準正規分布に従う標本データの2乗和が従う確率分布である。その和の数が自由度$k$と定義されている。
自由度$k$の$\chi^2$分布は、期待値は$k$、分散は$2k$となる。
$k=2$で期待値2の指数分布に一致する。




$t$分布とは:

$\chi^2$分布は標本データを正規化させる必要があるが、その際に母集団分布の平均と分散を知る必要があるが、通常、それは知ることができない。このとき、標本数が少ない場合に$\chi^2$分布は知識を与えない。代替として、$t$統計量を定義し、$t$分布を導入する。

$t=\frac{\bar{X}-\mu}{\sqrt{s^2/n}}$

上式は次のように変形できる。

$t=\frac{\bar{X}-\mu}{\sqrt{\sigma^2/n}}/\sqrt{\frac{(n-1)s^2}{\sigma^2}/(n-1)}$

分子$\frac{\bar{X}-\mu}{\sqrt{\sigma^2/n}}$は標準正規分布に従い、分母の$\sqrt{\frac{(n-1)s^2}{\sigma^2}}$は自由度$n-1$の$\chi^2$分布に従うことから、$t$統計量を次のように定義することができる。

$t=\frac{Z}{\sqrt{Y/k}}$

但し、
$Z\sim N(0,1)$
$Y\sim \chi^2(k)$

$\frac{Z}{\sqrt{Y/k}}$を$t$分布と呼ぶ。




$F$分布とは:
大きさ$n$の標本における標本分散$s^2$は、$\sigma^2$により標準化をすれば、自由度$n-1$の$\chi^2$分布に従う。
$\frac{s^2}{(n-1)\sigma^2}\sim \chi^2(n-1)$
$U$、$V$をそれぞれ自由度$k_1$、$k_2$の$\chi^2$分布に従う確率変数であるとする。フィッシャーの分散比を
$F=\frac{U/k_1}{V/k_2}$
と定義すると、この$F$が従う確率分布は自由度$k_1, k_2$の$F$分布と呼ばれる分布となる。
標準化された2標本の分散比$\frac{\sigma_2^2}{\sigma_1^2}\cdot \frac{s_1^2}{s_2^2}$は、$F$分布に従う。




$\chi^2$分布

chi2plot04Jul2013-mini.png

m1 <- 0
s1 <- 1
data <- rnorm(100000,mean=m1, sd=s1)
data2 <- (data-m1)^2
plotx <- hist(data2,breaks=seq(0,50,0.05))[[1]]
plotx <- plotx[c(2:length(plotx))]
ploty1 <- hist(data2,breaks=seq(0,50,0.05))[[2]]/100000

data <- rnorm(100000,mean=m1, sd=s1)
data3 <- (data-m1)^2
data2 <- data2 + data3
ploty2 <- hist(data2,breaks=seq(0,50,0.05))[[2]]/100000

data <- rnorm(100000,mean=m1, sd=s1)
data3 <- (data-m1)^2
data2 <- data2 + data3
ploty3 <- hist(data2,breaks=seq(0,50,0.05))[[2]]/100000

data <- rnorm(100000,mean=m1, sd=s1)
data3 <- (data-m1)^2
data2 <- data2 + data3
ploty4 <- hist(data2,breaks=seq(0,50,0.05))[[2]]/100000

data <- rnorm(100000,mean=m1, sd=s1)
data3 <- (data-m1)^2
data2 <- data2 + data3
ploty5 <- hist(data2,breaks=seq(0,50,0.05))[[2]]/100000

data <- rnorm(100000,mean=m1, sd=s1)
data3 <- (data-m1)^2
data2 <- data2 + data3
ploty6 <- hist(data2,breaks=seq(0,50,0.05))[[2]]/100000

mycol <- rainbow(6)

pdf("chi2plot04Jul2013.pdf",height=5.5,width=6,pointsize=14)
plot(plotx,ploty1,pch=20,xlim=c(0,20),ylim=c(0,1500/100000),col=mycol[1],
cex=0.5,xlab=expression(paste(chi^{2})),ylab="frequency")
par(new=T)
plot(plotx,ploty2,pch=20,xlim=c(0,20),ylim=c(0,1500/100000),col=mycol[2],
cex=0.5,xlab="",ylab="")
par(new=T)
plot(plotx,ploty3,pch=20,xlim=c(0,20),ylim=c(0,1500/100000),col=mycol[3],
cex=0.5,xlab="",ylab="")
par(new=T)
plot(plotx,ploty4,pch=20,xlim=c(0,20),ylim=c(0,1500/100000),col=mycol[4],
cex=0.5,xlab="",ylab="")
par(new=T)
plot(plotx,ploty5,pch=20,xlim=c(0,20),ylim=c(0,1500/100000),col=mycol[5],
cex=0.5,xlab="",ylab="")
par(new=T)
plot(plotx,ploty6,pch=20,xlim=c(0,20),ylim=c(0,1500/100000),col=mycol[6],
cex=0.5,xlab="",ylab="")
legend(16.5,0.015,c("k=1","k=2","k=3","k=4","k=5","k=6"),pch=20,col=mycol)
dev.off()
スポンサーサイト

コメントの投稿


非公開コメント

コメント

Profile

zoa

Author:zoa
Metropolis (1927)

Calendar
05 | 2017/06 | 07
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 -
Labels
Admin
Previous Posts
Recent Comments
Recent Trackback
Archive
このページのトップへ
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。