Ki-kare testi

Ki-kare testi veya χ² testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan bazıları parametrik olmayan sınama ve diğerleri parametrik sınama yöntemidir. Bu çeşit istatistiksel sınamalarda test istatistiği için "örnekleme dağılımı", sıfır hipotez gerçek olursa ki-kare dağılımı gösterir veya sıfır hipotez "asımtotik olarak gerçek" olursa, eğer sıfır hipotez gerçekse ve eğer örnekleme hacmi istenilen kadar yeterli olarak büyük ise bir ki-kare dağılımına çok yakın olarak yaklaşım gösterir.

Çeşitli ki-kare testleri

Ki-kare dağılımının yaklaşık olarak geçerli olduğu ki-kare testlerinin en çok kullanılan örnekleri şunlardır:

Pearson'un ki-kare testleri ve gelişmeleri

Örneklem verileri ikiden çok kategorili satırdan ve ikiden çok kategorili sütundan oluşan kontenjans tablosu olarak özetlenir ve (r-satırlı ve c-sütunlu) (rxc) tablo, hesaplar için ana veri olarak kullanılır. Bu test "bağımsızlık için ki-kare testi" veya "homojenlik testi" olarak istatistiksel çıkartımasal problemlere uygulanır. Bu çeşit problemlerde "sıfır hipotez" bir rassal değişkenin istasıksel parametre değerini sınamadığı için bu test parametrik olmayan sınama olduğu kabul edilir. Genellikle "Pearson'un ki-kare testi" en iyi bilinen "ki-kare testi" olup çok kere "ki-kare-testi" sözcüğü bu tip Pearson'un testi için kullanılır. "Pearson'un ki-kare testi"'nin çözümleme yöntemi iki değişik sınama sorunu için kullanılır ve bu iki çeşit örneklem veriler bir "kontenjans tablosu"nda özetlendikten sonra aynı şekilde uygulanır.

Bu tip için ki-kare testinin uygulandığı değişik kategorik değerler taşıyan (satır için değişkende r tane kategorili bir değişken ve sütün için değişkende c tane kategorili değişken) iki tane rassal değişken bulunduğu kabul edilir. Bu iki kategorik rassal değişkenin birbirinden "bağımsız" olup olmadıkları araştırma sorusu için uygulanır. Bu tip testte, sıfır hipotez satır rassal değişkeni ile sütun rassal değişkeninin birbirinden "bağımsız" ölduğudur ve "alternatif hipotez" "satır değişkeni ile sütun değişkeni birbirinden "bağımsız değildir" önerisidir. Dikkat edilirse bu testin sonucu simetrik değildir; hatta "zayıftır". Eğer sıfır hipotez test ile kabul edilirse sonuç "güçlü"dür ve uygulanmalara katkı yapabilir. Ama sıfır hipotez test ile rededilirse, yani iki rassal değişken "bağımsız değil" ise, sonuç "zayıftır ve ne derecede iki degiskenin ne derecede bağımlı oldukları bu testle gösterilmez.

Bu testte ise ikiden çok kategorik değerler taşıyan (yani c tane kategorili sütunla gösterilen) tek bir rassal değişken bulunduğu; ama anakitlenin içinde iki veya daha fazla sayıda (yani r tane kategorili satırla gösterilen) "kitle grubu" bulunduğu sorunu araştırma sorunu olur ve bu iki veya daha fazla kitle grubunun tek bir homojen anakitleden gelip gelmediği sinanir.

2x2 kontenjans tablosu testleri

"İki satır iki sütunlu (2z2)" kontenjans tablosu çoklu satırlı ve çoklu sütunlu kontenjans tablolarında gösterilebilinen verilerin en basitidir.. Onun için bu tip tablolarla özetlenebilen veriler üzerindeki ki-kare testleri özel şekiller alırlar. 2x2 kontenjanss tabloları halinde verilen veriler için kullanılan özel "ki-kare test"lerinden önemlileri şunlardır:

G-testleri

G-testleri "maksimum olabilirlilik" ve "olabilirlik-oranı" prensiplerine dayanan hipotez sınaması olup günümüzde Pearson'un ki-kare testi ve 2x2 kontenjans tabloları için ki-kare testleri yerine kullanılmaya başlanmıştır.

Ki-kare değerinde ile "birliktelik" ölçümü

"Ki-kare testi"'nin bağımsızlık testinin sonucu simetrik değildir; hatta "zayıftır". Eğer bağımsızlık sıfır hipotezi, test hesaplaması sonucunda kabul edilirse sonuç "güçlü"dür ve yapılan ki-kare testi sonucu uygulanmalara katkı yapabilir. Ama "sıfır hipotez" "Pearson'un ki-kare testi" sonucunda rededilirse, yani iki değişken "bağımsız değilse", sonuç "zayıf"tır. Çünkü bu iki kategorik değişkenin "birliktelikleri (associaton)" (yanı ne derecede birbirine bağımlı oldukları) bu testle öğrenilemz. Onun için iki kategorik değişken arasında bağımsızlık sıfır hipotezi Pearson'un ki-kare testi ile rededilirse ve bu iki kategorik değişken arasında "birliktelik" (yani bağımlılık derecesi) bulunmasi için ektara analiz uygulnamasi gerekir. Bu ekstra analiz ile iki kategorik değişken arasında "birliktelik" (İngilizce "association") katsayıları bulunması, iki niceliksel değişken arasında bulunması istenilenen korelasyon ilişkisine kavramsal olarak çok yakındır. İlk defa ortaya atılan "birliktelik" katsayıları kavramsal ve pratik olarak, önceden eldeki verilerle "hesaplanan ki-kare" değerlerini kullanmasına dayanmaktadır. Bu tip "birliktelik katasayıları" onun için, eğer "bağımsızlık bulunmazsa" ne derece bağımlılık bulmak hedefiyele yapılan ek işlemler halinde görülmektedir. Ama dshs sonradan diğer görüşlerle ede edilen "birliktelik" analizleri ve katsayısıları ortaya atılmıştır;; örneğin Goodman ve Kruskal'ın lambda katsayıları, entropi katsayısı vb.

Hesaplanan "Ki-kare" değeri kullanılarak elde edilen "birliktelik katsayı"ları değişik isimli ve nispeten küçük fark gösteren șu nitelikli katsayilar olabilirler:

İki tane iki-değerli isimsel değişken için 2x2 kontenjans tabloları ile özetlenen veri kullanarak bulunur. Bu katsayının en yüksek değeri eldeki veri sayısina bağlı olmaktadır ve 0.707'ye esittir.

İki tane çoklu-kstegorili isimsel değişken için rxc kontenjans tabloları ile özetlenen veri kullanarak bulunur. Bu katsayının en yüksek değeri de (phi-katsayisina benzer olarak) eldeki veri sayısina ve en buyuk sayida kategori sayisina bağlı olmaktadır.

İki tane çoklu-kategorili isimsel değişken için bulunur. Bu katsayının değeri (iki niceliksel değişken arasındaki korelasyon katsayısına benzer olarak) -1 ile +1 arasında değişebilmektedir.

Bu katsayi da iki tane çoklu-kategorili isimsel değişken için bulunur ama bu katsayının değeri 0 ile +1 arasında değişebilmektedir.

Ki-kare uygunluk iyiliği sınaması

Bu tip uygunluk iyiliği sınamasi icin hesaplama yöntemi "Pearson'un ki-kare testi"'ne gayet çok benzeyerek, tek bir "kategorik veri" halinde olan kategorik değişkenin veya kontenjans tablosu içinde sıniflanma yapılarak özetlmis bir niceliksel değişken verilerinin ne türlü dağılım gösterdiğini test eder. Veriler değişkenin kategori değeri halinde özellikle "tek düze ayrık dağılım'a uygunluk", binom dağılım'a uygunluk", Poisson dağılım'a uygunluk" ve eğer normal değerler sınıflandırılıp sınıf ortalaması kategori değeri gibi kullanılırsa "normal dağılım'a uygunluk" testleri olabilirler. Bu halde dağılımı kesin belirlemek için dağılım parametreleri "sıfır hipotez" içinde verilmesi gerekir. Bu nedenle genellikle bu tip test "parametrik olmayan istatistik" olarak kabul edilmekle beraber, sıfır hipotezde anakitle parametre değerleri belirtilmesi gerektiği için "parametrik çıkartım" nitelikleri de taşımaktadır.

Varyans değeri testi

Tek niceliksel değişken verisi için basit rassal örnekleme ile elde edilen veriler, eğer yeter derecede büyük sayıda ise elde edilen örneklem özetlenme değerleri icin ornekleme varyansi hesaplanip anakitle varyansinin belirli hakkinda sinama yapmak kullanilabilir . Bu varyans değeri testi genel olarak pratikte cok kullanilmaktadir cunku verilerin varyansi hakkinda cok kere arastirma sorusu cikmamaktadir.

Diğer ki-kare testleri

Ayrıca bakınız

Notlar

    Dış bağlantılar

    This article is issued from Vikipedi - version of the 12/25/2016. The text is available under the Creative Commons Attribution/Share Alike but additional terms may apply for the media files.