僕の頭の備考欄

徒然なるままに日々の発見を書き綴ります.数学/情報技術/ダンス 要するに雑記です.

統計検定1級 2018 統計数理 問3 解説

統計検定1級 2018 統計数理

大問3

パラメータ n,  \theta の二項分布 B(n,   \theta ) に従う確率変数を X とする.  Xの確率関数は

\begin{align}p(x) = P(X=x) = {}_n C _x \theta ^x (1 - \theta )^{n-x} \hspace{10mm} (x = 0, 1, \ldots , n) \end{align}

である. ここで {}_n C _x は二項係数である. 以下の各問に答えよ.

(1)

 X の期待値  E[X] と分散 V[X] を求めよ.

 X \sim B(n , \theta ) について,

\begin{align} E[X] &= n\theta\\ V[X] &= n\theta (1- \theta ) \end{align} である.

(2)

 X \le 1 の条件下での  X  の条件付き確率関数 h(x) = P(X=x | X \ge 1)

\begin{align} h(x) = \frac{ {}_n C _x \theta ^x (1 - \theta )^{n-x} }{ 1 - (1 - \theta ) ^n} \hspace{10mm} (x = 1, \ldots , n) \end{align}

であることを示せ.

条件付き確率を考える.

\begin{align} P(X=x | X \ge 1) &= \frac{ P(X=x , X \ge 1) }{ P(X \ge 1)} \\ &= \frac{ P(X=x ) }{ P(X \ge 1)} \end{align}

ここで,

\begin{align} P(X \ge 1) &= 1 - P(X = 0) \\ &= 1 - (1 - \theta ) ^n \end{align}

である. したがって,

\begin{align} h(x) &= \frac{ P(X=x ) }{ P(X \ge 1)} \\ &= \frac{ {}_n C _x \theta ^x (1 - \theta )^{n-x} }{ 1 - (1 - \theta ) ^n} \end{align}

(3)

 X の条件付き期待値  \eta (\theta ) = E[X | X \ge 1] と条件付き分散  \xi (\theta ) = V[X | X \ge 1] を求めよ.

 \begin{align} 
\eta (\theta ) 
&= E[X | X \ge 1] \\
&= \sum _{x=1} ^n x \ h(x) \\
&= \sum _{x=1} ^n x \cdot  \frac{  {}_n C _x \theta ^x (1 - \theta )^{n-x}  }{  1 - (1 - \theta ) ^n} \\
&=  \frac{ 1 }{  1 - (1 - \theta ) ^n}  \sum _{x=1} ^n x p(x) \\
&=  \frac{ 1 }{  1 - (1 - \theta ) ^n}  \sum _{x=0} ^n x p(x) \\
&=  \frac{ E[X] }{  1 - (1 - \theta ) ^n} \\
&=  \frac{ n \theta }{  1 - (1 - \theta ) ^n}
\hspace{10mm} \blacksquare
\end{align}

  V[X | X \ge 1] =  E[X^2 | X \ge 1]  -   E[X | X \ge 1]^2 を考える.

 \begin{align} 
E[X^2 | X \ge 1] 
&= \sum _{x=1} ^n x^2 \ h(x) \\
&=  \frac{ 1 }{  1 - (1 - \theta ) ^n}  \sum _{x=0} ^n x^2 p(x) \\
&=  \frac{ E[X ^2 ] }{  1 - (1 - \theta ) ^n}
\end{align}

ここで,

 \begin{align} 
E[X ^2] 
&= V [X ]  + E[X ] ^2 \\
&= n\theta (1- \theta ) + (n\theta )^2 \\
&= n\theta (1- \theta ) + n^2 \theta ^2
\end{align}

であるので,

 \begin{align} 
E[X^2 | X \ge 1] 
&=  \frac{ E[X ^2 ] }{  1 - (1 - \theta ) ^n} \\
&=  \frac{  n\theta (1- \theta ) + n^2 \theta ^2 }{  1 - (1 - \theta ) ^n} 
\end{align}

である. したがって,

 \begin{align} 
V[X | X \ge 1] 
&=  E[X^2 | X \ge 1]  -   E[X | X \ge 1]^2  \\
&=  \frac{  n\theta (1- \theta ) + n^2 \theta ^2 }{  1 - (1 - \theta ) ^n}  -   \left \{  \frac{ n \theta }{  1 - (1 - \theta ) ^n} \right \} ^2 \\
&=  \frac{  n\theta (1- \theta ) + n^2 \theta ^2 }{  1 - (1 - \theta ) ^n}  -  \frac{ n ^2 \theta ^2 }{   \left \{  1 - (1 - \theta ) ^n   \right \} ^2 } 
\hspace{10mm} \blacksquare
\end{align}

(4)

 n = 8 のとき,  \eta (\theta ) = 2 E[X] となるのは \theta がいくらのときか.

 \begin{align} 
& \eta (\theta ) = 2E[X ] \\
\iff & \frac{ n \theta }{  1 - (1 - \theta ) ^n} = 2n\theta \\
\iff & (1 - \theta )^n = \frac{1}{2}   \\
\iff & \theta = 1 - \left ( \frac{1}{2} \right ) ^{\frac{1}{n}}
\end{align}

 n=8 として,

\begin{align} \theta = 1 - \left ( \frac{1}{2} \right ) ^{\frac{1}{8}} \hspace{10mm} \blacksquare \end{align}

(5)

(2)で求めた条件付き分布からの独立な m個の観測値を y_1, \ldots , y_m とし, それらの標本平均を  \bar{y}  = ( y_1+ \ldots + y_m)/m とする. このとき, パラメータ \theta 最尤推定 \hat{\theta }の計算法を示せ. また,  \hat{\theta }はモーメント法に基づく推定値であることを示せ.

尤度関数 L(\theta )は,

\begin{align} L(\theta ) &= \prod _{i=1} ^{m} h(y_i) \\ &= \prod _{i=1} ^{m} \frac{ {}_n C _{y_i} \theta ^{y_i} (1 - \theta )^{n-y_i} }{ 1 - (1 - \theta ) ^n} \\ &= \frac{ 1 }{ \{ 1 - (1 - \theta ) ^n \} ^m } {}_n C _{y_1} \cdots {}_n C _{y_m} \theta ^{y_1 + \cdots + y_m} (1 - \theta )^{nm - (y_1 + \cdots + y_m)} \\ &= \{ 1 - (1 - \theta ) ^n \} ^{-m} {}_n C _{y_1} \cdots {}_n C _{y_m} \theta ^{m\bar{y}} (1 - \theta )^{nm - m\bar{y} } \end{align}

と書ける. 両辺の対数をとり,  \theta微分して対数尤度方程式を導く.

\begin{align} & \frac{d}{d\theta } \log L(\theta ) = 0 \\ \iff & \frac{d}{d\theta } \log \left[ \{ 1 - (1 - \theta ) ^n \} ^{-m} {}_n C _{y_1} \cdots {}_n C _{y_m} \theta ^{m\bar{y}} (1 - \theta )^{nm - m\bar{y} } \right ] = 0 \\ \iff & \frac{d}{d\theta } \left[ -m \log \left\{ 1 - (1 - \theta ) ^n \right \} + \log \left[ {}_n C _{y_1} \cdots {}_n C _{y_m} \right ] + m\bar{y} \log \theta + (nm - m\bar{y}) \log (1 - \theta ) \right] = 0 \\ \iff & -\frac{mn (1 - \theta ) ^n }{1 - (1 - \theta ) ^n } +\frac{m\bar{y}}{\theta} + \frac{mn - m\bar{y}} {1 - \theta } = 0 \\ \iff & n \theta = \bar{y} \{ 1- (1 - \theta ) ^n \} \end{align}

以上で \hat{\theta }が満たすべき対数尤度方程式 n \theta =  \bar{y} \{ 1-  (1 - \theta ) ^n \}  が得られた.

一般の nに対してこの方程式を代数的に解くのは極めて困難なので,  \hat{\theta }_0 を適当にとり,

\begin{align} \theta _{i+1} = \frac{1}{n} \bar{y} \{ 1- (1 - \theta _{i}) ^n \} \end{align}

を反復的に計算する.

先に導いた対数尤度方程式より標本平均が分布の期待値  E[X | X \ge 1 ] に一致するのでモーメント法に基づく推定値である.  \blacksquare