D'Agostino'nun K-kare sınaması

İstatistik bilim dalında D'Agostino'nun K2 sınaması normal dağılımdan ayrılmayı ölçmek için kullanılan bir uygulama iyiliği ölçüsüdür. Örneklem basıklık ve çarpıklık ölçülerinin dönüşümlerinden elde edilmiştir. K2 istatistiği şöyle elde edilir:

n değerinin gözlem sayısı ve böylelikle genellikle serbestlik derecesi olduğu bilinmektedir. Örneklem çarpıklık ölçüsü, \sqrt{b_1}, şöyle tanımlanır:


\sqrt{ b_1 } = \frac{ \mu_3 }{ \sigma^3 } = \frac{ \mu_3 }{ \left( \sigma^2 \right)^{3/2} } = \frac{ \frac{1}{n} \sum_{i=1}^n \left( x - \bar{x} \right)^3}{ \left( \frac{1}{n} \sum_{i=1}^n \left( x - \bar{x} \right)^2 \right)^{3/2}}

Örneklem basıklık ölçüsü, \sqrt{b_2} ise şöyle tanimlanır:


b_2 = \frac{ \mu_4 }{ \sigma^4 } = \frac{ \mu_4 }{ \left( \sigma^2 \right)^{2} } = \frac{\frac{1}{n} \sum_{i=1}^n \left( x - \bar{x} \right)^4}{\left( \frac{1}{n} \sum_{i=1}^n \left( x - \bar{x} \right)^2 \right)^2}

Burada \bar{x} örneklem ortalaması, σ2 ikinci merkezsel moment veya varyans ve sırasiyla μ3 ve μ4 üçüncü ve dördüncü merkezsel moment lerdir.

Dönüştürülmüş çarpıklık

Önce, çarpıklık ölçüsü \sqrt{b_1} 'nin bir dönüşümü olan

Z\left(\sqrt{b_1}\right)

hesaplanır. Verinin normal dağılım gösterdiğine dair sıfır hipotez geçerli ise, bu ifade yaklaşık olarak normal dağılım gösterir:


Y = \sqrt{b_1} \cdot \sqrt{\frac{(n+1)(n+3)}{6(n-2)}}

\beta_2\left(\sqrt{b_1}\right) = \frac{3(n^2+27n-70)(n+1)(n+3)}{(n-2)(n+5)(n+7)(n+9)}

W^2 = -1 + \sqrt{2 (\beta_2\left(\sqrt{b_1}\right) - 1)}

\delta = 1/\sqrt{ln(W)}

\alpha = \sqrt{\frac{2}{W^2-1}}

Z\left(\sqrt{b_1}\right) = \delta ln\left(Y/\alpha + \sqrt{(Y/\alpha)^2 + 1}\right)

Dönüştürülmüş Basıklık

Sonra, basıklık ölçüsü olan b_2 'in bir dönüşümü olan Z\left(b_2\right) hesaplanır. Verinin normal dağılım gösterdiğine dair sıfır hipotez geçerli ise, bu ifade de yaklaşık olarak normal dağılım gösterir:


E\left(b_2\right) = \frac{3(n-1)}{n+1}

\sigma^2_{b_2} = \frac{24n(n-2)(n-3)}{(n+1)^2(n+3)(n+5)}

x = \frac{b_2 - E\left(b_2\right)}{\sigma_{b_2}}

Bundan sonra ise, basıklık ifadesinin çaprazlığı bulunur:


\sqrt{\beta_1\left(b_2\right)} = \frac{6(n^2-5n+2)}{(n+7)(n+9)} \sqrt{\frac{6(n+3)(n+5)}{n(n-2)(n-3)}}

A = 6 + \frac{8}{\sqrt{\beta_1\left(b_2\right)}} \left[ \frac{2}{\sqrt{\beta_1\left(b_2\right)}} + \sqrt{1+\frac{4}{\beta_1\left(b_2\right)}}\right]

Z\left(b_2\right) = \left(\left(1 - \frac{2}{9A}\right) - \sqrt[3]{\frac{1-2/A}{1+x\sqrt{2/(A-4)}}}\right)\sqrt{\frac{9A}{2}}

İçerikli K2 istatistiği

Şimdi, bu Z\left(\sqrt{b_1}\right) ile Z\left(b_2\right) ifadelerini birleştirip normallik sınaması için D'Agustino'nun sinama istatistigi şöyle tanımlanır:


K^2 = \left(Z\left(\sqrt{b_1}\right)\right)^2 + \left(Z\left(b_2\right)\right)^2

K^2 istatistiği yaklaşık olarak serbestlik derecesi 2 olan bir \chi^2 ile dağılım gösterir.

İçsel kaynaklar

Kaynak


Referanslar

This article is issued from Vikipedi - version of the 2/15/2016. The text is available under the Creative Commons Attribution/Share Alike but additional terms may apply for the media files.