僕の頭の備考欄

徒然なるままに日々の発見を書き綴ります.数学/情報技術/ダンス 要するに雑記です.

統計検定1級 2018 統計数理 問1 解説

統計検定1級 2018 数理

大問1

互いに独立に正規分布 N(\mu , \sigma ^2)に従う n個の確率変数 X_1 , \ldots X_n (n\le 2)に対して, 標本平均を \displaystyle{\bar{X} = \frac{1}{n} \sum _{i=1}^{n} X_i}, 標本分散と標本標準偏差をそれぞれ \displaystyle{S^2 = \frac{1}{n-1} \sum _{i=1}^{n} ( X_i - \bar{X} )^2},  S = \sqrt{S^2}とするとき, 以下の各問に答えよ.

 

(1)

 S^2は母分散 \sigma ^2の不偏推定量であること, すなわち E[S^2] = \sigma ^2を示せ.

\begin{align} \sum _{i=1}^{n} (X_i - \mu)^2 &= \sum _{i=1}^{n} (X_i - \bar{X} + \bar{X} - \mu) ^2 \\ &= \sum _{i=1}^{n} \left( (X_i - \bar{X})^2 +2(X_i - \bar{X})(\bar{X} - \mu) + (\bar{X} - \mu)^2 \right ) \\ &= \sum _{i=1}^{n} (X_i - \bar{X})^2 + \sum _{i=1}^{n} 2(X_i - \bar{X})(\bar{X} - \mu) + \sum _{i=1}^{n} (\bar{X} - \mu)^2 \\ &= \sum _{i=1}^{n} (X_i - \bar{X})^2 + n(\bar{X} - \mu)^2 \hspace{10mm} \therefore \sum _{i=1}^{n} (X_i - \bar{X}) = 0 \\ \iff \sum _{i=1}^{n} (X_i - \bar{X})^2 &= \sum _{i=1}^{n} (X_i - \mu)^2 - n(\bar{X} - \mu)^2 \hspace{15mm}\clubsuit \end{align}

ここで,

 \displaystyle{E[\bar{X}] = E\left[\frac{1}{n} \sum _{i=1}^{n} X_i \right] = \frac{1}{n}\sum _{i=1}^{n}E[X_i] = \frac{1}{n} \cdot n \cdot \mu = \mu}

 \displaystyle{V[\bar{X}] = V\left[\frac{1}{n} \sum _{i=1}^{n} X_i \right] = \frac{1}{n^2}\sum _{i=1}^{n}V[X_i] = \frac{1}{n^2} \cdot n \cdot \sigma ^2 = \frac{\sigma ^2}{n}}

 \displaystyle{E[\bar{X}^2] = V[\bar{X}] + E[\bar{X}]^2 = \frac{\sigma ^2}{n} + \mu ^2}

 \displaystyle{ E[(\bar{X} - \mu)^2] = E[\bar{X}^2] -2\mu E[\bar{X}] + \mu ^2 = \frac{\sigma ^2}{n} }

に注意して \clubsuit式の両辺を n-1で割って期待値を取ると,

 \begin{align} E[S^2 ] = E\left[ \frac{1}{n-1} \sum _{i=1}^{n} (X_i - \bar{X})^2 \right] &= \frac{1}{n-1}\sum _{i=1}^{n} (X_i - \mu)^2 - \frac{n}{n-1}(\bar{X} - \mu)^2 \\ &= \frac{1}{n-1} \cdot n \sigma^2 - \frac{n}{n-1} \cdot \frac{\sigma ^2}{n} \\ &= \sigma ^2 \hspace{10mm}\blacksquare \end{align}

 

(2)

自由度 n-1カイ二乗分布に従う確率変数を Yとしたとき, その確率密度関数

$$ g(y) = \begin{cases} \frac{1}{\Gamma ( \frac{n-1}{2} )} \left ( \frac{1}{2} \right ) ^{\frac{n-1}{2} } y ^{\frac{n-1}{2} -1} e ^{- \frac{y}{2} } & ( y \geq 0) \\ 0 & ( y < 0) \end{cases} \hspace{25mm}(1) $$ で与えられる. ここで \displaystyle{ \Gamma (z) = \int _0 ^{\infty } t ^{z-1} e ^{-t} dt }はガンマ関数である. (1)に関する積分を用いて,  Yの期待値と分散はそれぞれ n-1,\    2(n-1)であることを示せ. それにより,  S^2の分散 V[S^2]を求めよ.

\begin{align} E[Y] &= \int _0 ^{\infty} y \ g(y) dy \\ &= \int _0 ^{\infty} y \cdot \frac{1}{\Gamma ( \frac{n-1}{2} )} \left ( \frac{1}{2} \right ) ^{\frac{n-1}{2} } y ^{\frac{n-1}{2} -1} e ^{- \frac{y}{2} } dy \\ &= \frac{1}{\Gamma \left( \frac{n-1}{2} \right)} \left ( \frac{1}{2} \right ) ^{\frac{n-1}{2} } \int _0 ^{\infty} y ^{\frac{n-1}{2} } e ^{- \frac{y}{2} } dy \end{align}

ここで, 積分の項について \displaystyle{ \frac{y}{2} = t }と変換を行うと,

\begin{align} \int _0 ^{\infty} y ^{\frac{n-1}{2} } e ^{- \frac{y}{2} } dy &= \int _0 ^{\infty} (2t) ^{\frac{n-1}{2} } e ^{- t } \cdot 2 \ dt \\ &= 2 ^{\frac{n+1}{2} } \int _0 ^{\infty} t ^{\frac{n-1}{2} } e ^{- t } \ dt \\ &= 2 ^{\frac{n+1}{2} } \Gamma \left( \frac{n+1}{2} \right) \end{align}

よって,

\begin{align} \frac{1}{\Gamma \left( \frac{n-1}{2} \right)} \left ( \frac{1}{2} \right ) ^{\frac{n-1}{2} } \int _0 ^{\infty} y ^{\frac{n-1}{2} } e ^{- \frac{y}{2} } dy &= \frac{1}{\Gamma \left( \frac{n-1}{2} \right)} \left ( \frac{1}{2} \right ) ^{\frac{n-1}{2} } 2 ^{\frac{n+1}{2} } \Gamma \left( \frac{n+1}{2} \right) \\ &= 2 \cdot \frac{n-1}{2} \\ &= n-1 \end{align}

であり,  E[Y] = n-1が示された.

 V[Y ] についても同様に示す.

\begin{align} V[Y] &= \int _0 ^{\infty} \left( y - E[Y] \right) ^2 g(y) dy \\ &= \int _0 ^{\infty} \left( y - (n-1) \right) ^2 g(y) dy \\ &= \int _0 ^{\infty} y^2\ g(y) dy -2 (n-1) \int _0 ^{\infty} y\ g(y) dy + (n-1)^2 \int _0 ^{\infty} g(y) dy \\ &= (n+1)(n-1) -2(n-1)^2 + (n-1)^2 \\ &= 2(n-1) \hspace{10mm}\blacksquare \end{align}

標準正規分布に従う確率変数  n 個の和は自由度  n-1カイ二乗分布に従う. それにより,  \frac{\sum _{i=1} ^n(X_i - \bar{X} ) ^2}{\sigma ^2} は自由度  n-1カイ二乗分布に従うことを用いる.

 \begin{align}
V[S^2] 
&= V\left[\frac{1}{n-1} \sum _{i=1} ^n (X_i - \bar{X} ) ^2 \right] \\
&=\frac{1}{(n-1)^2} V\left[\sigma ^2 \frac{\sum _{i=1} ^n (X_i - \bar{X} ) ^2}{\sigma ^2} \right] \\
&=\frac{1}{(n-1)^2} \cdot \sigma ^4 \cdot V\left[\frac{\sum _{i=1} ^n (X_i - \bar{X} ) ^2}{\sigma ^2} \right] \\
&=\frac{1}{(n-1)^2} \cdot \sigma ^4 \cdot 2(n-1) \\
&=\frac{2 \sigma ^4 }{n-1} \hspace{10mm}\blacksquare
\end{align}

 

(3)

上問(2)の Y平方根  \sqrt{Y} の期待値を確率密度関数(1)に関する積分を用いて求めよ. それにより標本標準偏差  S の期待値 E[S] を求めよ.

(2)のときと同様にする.

\begin{align} E[\sqrt{Y}] &= \int _0 ^{\infty} y^{\frac{1}{2}} \ g(y) dy \\ &= \frac{1}{\Gamma \left( \frac{n-1}{2} \right)} \left ( \frac{1}{2} \right ) ^{\frac{n-1}{2} } \int _0 ^{\infty} y ^{\frac{n}{2} -1} e ^{- \frac{y}{2} } dy \\ &= \frac{1}{\Gamma \left( \frac{n-1}{2} \right)} \left ( \frac{1}{2} \right ) ^{\frac{n-1}{2} } 2 ^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right) \\ &= \frac{\sqrt{2}\ \Gamma \left( \frac{n}{2} \right)}{\Gamma \left( \frac{n-1}{2} \right)} \hspace{10mm}\blacksquare \end{align}

したがって,  E\left[\frac{\sum _{i=1} ^n (X_i - \bar{X} )^2 }{\sigma ^2} \right ] =  \frac{\sqrt{2}\   \Gamma \left( \frac{n}{2} \right)}{\Gamma \left( \frac{n-1}{2} \right)} であることに注意すれば,

 \begin{align}
E [S] 
&= E\left[ \sqrt{\frac{1}{n-1} \sum _{i=1} ^n (X_i - \bar{X} ) ^2} \right] \\
&= \sqrt{\frac{1}{n-1} }E\left[ \sqrt{ \sigma ^2 \frac{ \sum _{i=1} ^n (X_i - \bar{X} ) ^2}{ \sigma ^2} } \right] \\
&= \sqrt{\frac{1}{n-1} }  \cdot \sigma \cdot E\left[ \sqrt{ \frac{ \sum _{i=1} ^n (X_i - \bar{X} ) ^2}{ \sigma ^2} } \right] \\
&= \sigma  \sqrt{\frac{1}{n-1} }  \frac{\sqrt{2}\   \Gamma \left( \frac{n}{2} \right)}{\Gamma \left( \frac{n-1}{2} \right)} \\
&= \sigma \sqrt{\frac{2}{n-1} } \frac{ \Gamma \left( \frac{n}{2} \right)}{\Gamma \left( \frac{n-1}{2} \right)}
\hspace{10mm}\blacksquare
\end{align}

 

(4)

nが十分大きいとして, 母標準偏差 \sigma の推定値としての偏り  E[S] - \sigma  n^{-1} のオーダーまで求めよ.

ヒント: デルタ法の適用, あるいはスターリングの公式  \Gamma ( n ) \simeq  \sqrt{2\pi } (n-1)^{n - \frac{1}{2}} e^{ -(n-1) } を用いる.

デルタ法を用いる.

確率変数 Tについての関数 f(T) に対して,  f(T) E[ T ] 周りの2次までのテイラー展開により,   \displaystyle{E[ f(T) ] \approx  f( E[ T ] ) + \frac{1}{2} V[ T ] f''( E[ T ] )}  と近似できる.

 f(T) = \sqrt{T}に対して  T = S^2 とすれば,

 
\begin{align}  
E[ S ]  
&= E[ f(S^2) ]  \\
&\approx  f( E[ S^2 ] ) + \frac{1}{2} V[ S^2 ] f''( E[ S^2 ] ) \\
&=  \sqrt{\sigma ^2} + \frac{1}{2} \cdot  \frac{2 \sigma ^4 }{n-1} \cdot \left( -\frac{1}{4 \sqrt{(\sigma ^2)^3} } \right ) \\
&= \sigma  - \frac{\sigma  }{4(n-1)}
\end{align}

であるので,

 
\begin{align}  
E[ S ]  - \sigma 
\ \approx \ \sigma  - \frac{\sigma  }{4(n-1)} 
= -\frac{\sigma  }{4(n-1)} 
\hspace{10mm}\blacksquare
\end{align}