Tek anakütle ortalaması için parametrik hipotez sınaması
Tek anakütle ortalaması için parametrik hipotez sınaması veya tek-örneklem için sınama veya μ için sinama bir rastgele örneklem ortalaması ile bu örneklemin çekilmiş olduğunu düşündüğümüz anakütlenin μ ile belirtilen "anakütle ortalaması" hakkinda bir hipotez değeri belirtilmesinin anlamlı olup olmadığını araştırmamızı sağlayan parametrik hipotez sınamasıdır.
Tek anakütle ortalaması testi için temel varsayımlar
- Örnekleme alınan birimler birbirlerinden bağımsız olarak rastgele seçilmiş olmaları
- Anakütle ya normal dağılıma sahip olmalı ya da örneklem hacminin iyice bilinmesi.
Tek anakütle ortalaması hipotez testinin aşamaları
Bir anakütleden basit olasılık örnekleme yöntemi kullanarak "n" örneklem büyüklüğü olan bir rastgele örneklem ele geçirilir; istenilen değerler ölçülür ve (x bar diye okunur) değerindeki örneklem ortalaması bulunur. Hipotez sınamasi yönteminde araştırma hedefi bu örneklemin söz konusu anakütleden çekilmiş olup olamayacağını ya da kaynağı olan anakütleden çekilmiş olabilmesinin olasılığının ne olabileceğini ortaya koymaktır.
- . İncelenen arastırma sorusu belirlenmesi;
- . Sıfır hipotez ve karşıt hipotez oluşturulması;
- . Örnekleme dağılımı ve kritik değer belirlenmesi;
- . Ret alanının belirlenmesi
- . Anlamlılık seviyesi ve şu iki alternatiften biri
- . Test-istatistiği saptanması;
- . p-değeri saptanması;
- . Karşılaştırmalar, sonuç ve yorum
Bir pratik örnek problem
Alçı dolum makinamız μo=20 kg ortalama ağırlıklı alçı dolumu yaparken arıza yapar. Tamirci getirip tamir ettiririz. Acaba yine μo=20kglık dolum yapabilecek mi?
Deneme yapıp görmek lazım!'
40 torba basit rastgele örnekleme yöntemine göre seçilip bu 40 alçı torbası ağırlıkları şöyle ölçülmüştür:
= 19,8 kg,
= 20,5 kg,
= 21,2 kg,
= 18,9 kg,
- .......,
= 20,8 kg
Örneklem istatistikleri şöyle hesaplanmıştır: Örneklem büyüklüğü : n = 40 torba Örneklem ortalaması : = 21,4 kg Örneklem standard sapması: s' = 3,2 kg
Bu problem için yapılan varsayımlar: -Anakütle yani alçı dolum makinasının yaptığı dolum miktarları normal dağılıma uymaktadır. -Dolum için anakütle standard sapması bilinmemekte ama (yanlılık için ayarlama yapılan) örneklem standart sapması (s') anakütle standart sapması σ için iyi bir kestirimdir.
İncelenen araştırma sorusunun belirlenmesi
Araştırma sorunu tek bir anakütle parametresi, yani anakütle ortalaması , hakkındadır. Bu anakütle ortalama değeri tam olarak bilinmemekte ve belirlenen bir hipotez değerde (Mü sıfır diye okunur) olduğu varsayılmaktadır. Hipotez testi anakütle ortalamasına verilen değer hakkındadır.
İstenilen araştırma sorusunun tayininde en önemli ilk adım, araştırma sorusunun tayininde, istenilen veya istenmeyen alternatifler ile test edilecek parametrenin belirtilen bir değere eşitsizlik şartına bakılmasıdır. Bu eşitsizlik bir "katı eşitsizlik" midir (yani ≠ veya > veya <) yoksa bir eşitliği de ihtiva eden bir "zayıf esitsizlik" midir (≤ veya ≥)? Araştırma sorusunun ya katı eşitsizliği ihtiva edip etmediğini mantık yürüterek bulmak gerekmektedir.
Ör./Verilen alçı doldurma makinası örnek problemi için belirtilen anakutle ortalama değerinin μ=20 olması gerekir. Biraz mantık yürütürsek, hem doldurma ortalamasının 20 kg'den düşük doluş yapmasının hem de doluşun 20 kg'dan daha fazla olması halinin istenmeyen sonuçlar olduğunu kabul edebiliriz. Eğer anakütle ortalaması 20 kg değilse, makina isteğe uygun tamir edilmemiştir; yani araştırma sorusu "katı eşitsizlik" (yani ≠) ihtiva eder.
Sıfır hipotez ve karşıt hipotez oluşturulması
"Sıfır hipotez" (notasyona göre Ho) değerinin oluşturması için hiç problem yoktur. Her türlü parametrik sınamada ve özellikle μ için sınamada, sıfır hipoteze göre μ mutlaka belirtilen parametre değerine (μo) eşit olur:
- Ho: μ = μo
Araştırma sorusu ne olursa olsun mutlaka Ho bu prensibe uyar.
Fakat karşıt hipotez veya alternatif hipotez (notasyona göre H1) oluşturulması biraz karmaşık olabilir. Karşıt hipotez problemin istediği araştırma sorusu ile ortaya çıkar. Parametrik sınamada karsit hipotezin mutlaka uyduğu bir prensip vardır. Bu prensip
- Karşıt hipotez hiçbir zaman eşitlik olamaz.
Karşıt hipotezin ya "eşit değil (≠)" ya "daha düşük değerde (<)" ya da "daha yüksek değerde (>)" olması gerekir. Bunlardan hangisi olacağı önemlidir; çünkü istatistiksel sınamada ret etme bölgesinin nerede olacağı bu karşıt hipotez eşitsizlik şekline dayanır.
Problemin ve araştırma sorusunun tanınması icin ilk yapılacak, istenilen araştırma sorusunun parametrenin belirtilen değere eşit olması şartı ihtiva edip etmediğini tayin etmektir. Araştırma sorusu eşitsizliği ya eşitliği ihtiva eder ya ihtiva etmez ve bu gerçekten ayrı şekillerde karşıt hipotez ortaya çıkar. Bu alternatifleri bir sıraya koyalım ve her alternatifin örnek problemde nasıl ifade edileceğini gösterelim:
1. Eğer araştırma sorusu eşitlik ihtiva etmekteyse: Bu halde probleme çözüm, sıfır hipotezin kabul edilmesi ve karşıt hipotezin ret edilmesi ile verilecektir. Karşıt hipotez istenilen araştırma sorunun aksi işaretli olacaktir. Üç alternatif bulunabilir:
(1.a.) Araştırma sorusunda anakütle ortalamasının belirtilen değere eşit olduğu araştırılmakta ise:
Bu örnek problemde soru "Acaba dolum ortalaması 20kg midir yani μo=20kg ?" Bu halde araştırma sorusunun aksi işaretli karşıt hipotez μo≠20 kg olur yani hipotezler
- Ho=20 H1≠20
olur.
(1.b.) Araştırma sorusunda anakütle ortalamasının belirtilen değere eşit veya daha küçük olduğu araştırılmakta ise:
Bu örnek problemde soru "Acaba dolum ortalaması, 20kg veya daha aşağı değer de midir yani μo≤20kg ?" olur. Aksi işaretli karşıt hipotez bu halde μo>20 kg olur; yani hipotezler şunlardır:
- Ho=20 H1>20
(1.c.) Araştırma sorusunda anakütle ortalamasının belirtilen değere eşit veya daha büyük olduğu araştırılmakta ise:
Bu örnek problemde soru "Acaba dolum ortalaması 20kg veya daha yüksek değer de midir yani μo≥20kg ?" Bu halde araştırma sorusuna aksi işaretli karşıt hipotez μo<20 kg olur yani hipotezler
- Ho=20 H1<20
2. Eğer araştırma sorusu eşitsizlik ihtiva etmekteyse:
Bu halde probleme çözüm sıfır hipotezin ret edilmesi ve karşıt hipotezin kabul edilmesi ile verilecektir. Karşıt hipotez istenilen araştırma sorunun ayni işaretli olacaktır. Üç alternatif bulunabilir:
(2.a.) Anakütle ortalamasının belirtilen değere eşit olmadığı araştırma sorusudur:
Örnek problemde soru "Acaba dolum ortalaması 20kg değil midir yani μo≠20kg ?" Bu halde araştırma sorusuna ayni işaretli karşıt hipotez μo≠20 kg olur yani hipotezler
- Ho=20 H1≠20
(2.b.) Araştırma sorusu anakütle ortalamasının belirtilen değerden daha küçük olduğu araştırılmakta ise:
Bu örnek problemde soru "Acaba dolum ortalaması 20kgdan daha aşağı değer de midir yani μo<20kg ?" Ayni işaretli karşıt hipotez bu halde μo<20 kg olur; yani hipotezler
- Ho=20 H1<20
(2.c.) Araştırma sorusu anakütle ortalamasının belirtilen değerden daha büyük olduğu araştırılmakta ise:
Bu örnek problemde soru "Acaba dolum ortalamasi 20kgdan daha yüksek değer de midir yani μo>20kg ?" Bu halde araştırma sorusuna ayni işaretli karşıt hipotez μo>20 kg olur yani hipotezler
- Ho=20 H1>20
Ör./ Verilen pratik problem için belirtilen anakütle ortalama değeri μ=20 olması yani
- Ho : μ = 20
Karşıt hipotez için hem ortalama 20 kg'den düşük hem de 20 kg'dan daha fazla dolum istenmeyen sonuçlar olduğu için karşıt hipotez anakütle ortalamasının 20 olmamasıdır; yani
- 'H1 : μ ≠ 20 .
Örnekleme dağılımı ve kritik değer belirlenmesi
Hipotez sınaması problemi için değişkenin dağılımı ve örneklem hacminin büyüklüğü, örnekleme dağılımı ve örnekleme dağılımı için kullanılması gereken olasılık dağılımını tespit etmek için kullanılır. Üç alternatif bulunur: 1. Anakütlenin normal dağılım gösterdiği bilinir veya bilindiği kabul edilir. Anakütle normal dağılım gösterirse örneklem hacmi ne olursa olsun (büyük veya küçük farketmeden) örneklem ortalamasının örnekleme dağılımının normal dağılım olduğu; örnekleme dağılımının örnekleme ortalamasının belirtilen anakütle dağılımına yani;
- μ=μo
ve standart hatası (yani örneklem ortalamasının örnekleme dağılımının standart sapmasının ya verilen anakütle stardart sapmasının veya kestirim anakütle standart sapmasının örneklem hacmi karesine bölünmesi) şu olur;
Bu halde örnekleme ortalamasının z-değeri, yani kritik değer, şöyle bulunur:
Bu nedenle bu türlü tek anakütle ortalaması sınaması z-testi olarak da adlandırılır.
2. Anakütlenin normal dağılım gösterdiği bilinmez ve bu varsayım olarak da kabul edilmez. Bu halde iki alternatif bulunmaktadır: ( 2.a.) Basit rastgele örneklem yöntemini göre elde edilmiş n ile ifade edilen örneklem büyüklüğü büyüktur. Bu büyük örneklem hacmi pratikte örneklem veri sayısının 30dan büyük olmasi yani
- n > 30
olarak kabul edilir. Bu halde örneklem ortalaması dağılımı için merkezsel limit teoremi uygulanabilir ve örnekleme dağılımı yaklaşık olarak
- μ=μo ornekleme ortalamali
ve
örneklem standart hatalı bir normal dağılım ile belirlenir. Bu halde örnekleme ortalamasının z-değeri, kritik değer, şöyle bulunur:
Bu türlü tek anakütle ortalama sınaması da z-testi olarak adlandırılır.
( 2.b.) Basit rastgele örneklem yöntemini göre elde edilmiş örneklem büyüklüğü küçüktür yani
- n ≤ 30
Bu halde 1906de Student" lakabını taşıyan William Sealy Gosset tarafından bulunan [[Student'in t dağılımı]] uygundur ve bu dağılımın t-testi adıyla küçük örneklem verileri için tek anakütle ortalaması için hipotez sınaması için kullanılması tavisye edilir. Bu halde hipotez testine t-testi adı verilir. Bu halde örnekleme ortalamasının t-değeri, kritik değer, şöyle bulunur:
Bu t-dağılımının tam tesbiti için ν veya serbestlik derececesi adlı bir parametrenin bulunması da gerekir. Tek anakütle ortalaması için hipotez test için serbestlik derecesi örneklem hacmi eksi bir olur; yani
- ν = n - 1
olur.
Ör./ Verilen pratik alçı doldurma makinası problemi için anakütlenin normal dağılım göstermesi varsayımı uygun görülebilir. Eğer anakütle için normallik varsayımı yapılmasa bile, örneklem hacmi 40 (yani n>30) olarak büyük olduğu kabul edilir. Ayrıca örneklem standart sapmasının anakütle standart sapması için en iyi kestirim olduğu varsayılır. Bu nedenle örnekleme dağılımı standart hatası şöyle hesaplanır:
ve z-değeri veya kritik değer
olur.
Ret alanının belirlenmesi
Ret alanı demek; standart normal dağılım (z-dağılım) veya Student'in t dağılımı (t-dagilimi) eğrisi altında ve ortasinda seçtiğimiz (Ho'ın kabul alanı dışında kalan Ho'ın reddedilmesini sağlayan küçük alanlardır. Ret alani karsit hipoteze baglidir ve uc alternatif sekilde olur:
- Eger karsit hipotez eşitsizlik ise yani
- H1≠ μo
o zaman cift yonludur yani z-dagilimi veya t-dagilimi egrilerinin alt-kuyrugu ve ust kuyrugunda bulunur. Eger biraz ilerideki aciklanacak anlamlilik seviyesi olan α kullanirsak her iki kuyruk altina kalan alan α/2 olur; iki kuyruktaki ret alani toplami α ve ortada bulunan ve kabul alani 1-α olur.
- Eger karsit hipotez daha buyuk ise yani
- H1 > μo
ise, o zaman sol-yonludur yani z-dagilimi veya t-dagilimi egrilerinin ust-kuyrugunda bulunur. Bu kuyruk altina kalan alan ve ret alani α ve ortada sagda bulunan ve kabul alani 1-α olur.
- Eger karsit hipotez daha kucuk ise yani
- H1 < μo
ise, o zaman sag-yonludur yani z-dagilimi veya t-dagilimi egrilerinin alt-kuyrugunda bulunur. Bu kuyruk altina kalan alan ve ret alani α ve ortada solda bulunan ve kabul alani 1-α olur.
Ör./Verilen pratik alci doldurma makinasi problemi icin karsit hipotez 'H1 : μ ≠ 20 oldugu icin ret alani cift yonludur ve hem alt ve hem ust kuyrukta bulunur.
Anlamlılık seviyesi ve isteğe göre test istatistiği veya p-değeri saptanması
Anlamlılık seviyesinin belirlenmesi
Hatasız bir orneklem bulamayacağımız için her testte bir miktar yanılma riskimiz vardır. Bunu 0,05 ; 0,01 ; 0,005 ; 0,0001;... gibi bir seviye olarak benimseyebiliriz. Yanılma payımız kuculdukçe, testin anlamlilik seviyesi de kuculur. O nedenle istatistikçiler olabildiğince az yanılma ile test yapmak isterler. Yine de α =0,05 ve &alfa;=0,01 düzeyleri en çok kullanılanlardır.
Ör./ Alci doldurma makinasi problemi icin α=0,05 secelim.
Burada tek anakutle ortalamasi icin hipotez sinamasi, her turlu parametrik hiptez sinamsi gibi, iki alternatif sekilde devem edilebilir: ya '"test istatistigi" bulunur ya da "p-değeri" bulunur.
İstenirse test istatistiği belirlenmesi
Birinci alternatif, hesapların elle yapılması ve özel standart normal veya Student-t dağılımı tabloları kullanılması için çok uygundur ve eski usulde yapılan analizdir. Bu halde "anlamlılık seviyesi"ne uygun bir z-skor veya t-skoru (yani bu seviyeye tekabül eden normal veya t-eğrileri altındaki alanlar) bulunur. Buna test istatistiği denilir. Buna hedef elde elde edilen kritik değer ile tablodan bulunan test istatistiğini karşılaştırmaktır. Yani bulunacak test istatistiği"
- İki-yönlü ret alanı için iki sınır değer ± zα÷2 veya ±tν,α÷2 ν=n-1;
- Sağ-yönlü ret alanı için alt sınır değer: +zα veya +tν,α ν=n-1;
- Sol-yönlü ret alanı için üst sınır değer: -zα veya -tν,α ν=n-1
olur. Bunlar için özel standart normal dağılım tablosu veya Student t dağılım tablosu bulunur.
Or./Verilen pratik alçı doldurma makinası problemi için iki-yönlü ret alanı olduğunu bulmuş, z-dağılımının uygun olduğunu tesbit estmiş ve anlamlılık seviyesini 0,05 olduğunu kabul etmiştir; böylece "test istatistiği"
- ± z0,05/2 = ±z0,025
olur. Bir "standart normal dağılım tablosu"na bakarsak, "test istatistiği"nin değerinin ±1.96 olduğu bulunur.
İstenirse p-değeri belirlenmesi
İkinci alternatif, hesapların komputer kullanılarak yapılması suretiyle ortaya çıkar. Örneğin "Open Office Calc" gibi kutuçizim programları özel olarak NORMAL veya TDIST fonksiyonları için komutaları kullanarak veya "R" özel "istatistik paketi" programlarını kullanarak ters-Z veya ters-t yöntemi ile "p-değeri" bulunur. "P-değeri" kritik değer olan z-değer veya t-değerin, karşıt eğrilerin altında ne kadar alan kapladıklarını yani kritik değer olasığını (p İngilizce "probabaility" kelimesinden çıkarılmış) bulmaktır. Genel olarak p-değeri hep üst-kuyruk altında kalan alan değerini verir; ama bunun kullanılan "kutuçizim" ve "istatistik paketi" programlarında kontrol edilmesi gerekir çünkü değişik kuyruk değerleri de verildiği görülür. Böylece bu p-olasılığı "anlamlılık seviyesi" olasılığı ile karşılaştırmak hedef alınır.
Karşılaştırma, sonuç ve yorum
Bir hipotez testinde sonuç
- ya "sıfır hipotezi red etmek" yani "karşıt hipotezi" kabul etmek
- ya da "sıfır hipotezi kabul etmek" yani "karşıt hipotezi" ret etmek;
olur. Bunun için önceki basamaktaki kullanılan iki alternatife göre şu karşılaştırmadan biri yapılır:
- ya "kritik değer" ile "test istatistiği" ;
- ya da "p-değeri" ile "anlamlılık seviyesi" .
Bu karşılaştırmaya göre sonuç ret alanına düşerse "sıfır hipotez" rededilir:
- "Kritik değer" ile "test istatistiği" karşılaştırılaması halinde:
- Eğer ret alanı iki-yönlü ise, "kritik değer" pozitif ve negatif iki "test istatistiği" değerleri dışına düşerse;
- Eğer ret alanı sağ-yönlü ise, "kritik değer" pozitif "test istatistiği" değerinden yüksekse;
- Eğer ret alanı sol-yönlü ise, "kritik değer" negatif "test istatistiği" değerinden düşükse;
- "p-değer" ile "anlamlılık seviyesi" karşılaştırılaması halinde:
- Eğer ret alanı iki-yönlü ise, "p-değeri" - alpha/2; değeri altına ve + alpha/2 üstüne düşerse;
- Eğer ret alanı sağ-yönlü ise, "p-değeri değeri" +alpha değerinden altına düşerse;
- Eğer ret alanı sol-yönlü ise, "kritik değer" -alpha değerinden üstüne düşerse.
Or/ Örnek alçı doldurma makinesi problemi için şu karşılaştırmalar yapılıp sonuç çıkartılabilir:
- İki-yönlü ret alanı: Kritik değer=2,767. Test istatistiği=±1,96. Kritik değer pozitif +1.96 dışına düşmekte. "Sıfır hipotez" ret edilmelidir ("Karşıt hipotez" kabul edilmelidir.)
- İki yönlü ret alanı: p-değeri= ...... + alpha/2=±0,025. p-değeri üst +0.025 seviyesinden daha küçüktür. "Sıfır hipotez" ret edilmelidir ("Karşıt hipotez" kabul edilmelidir.)
Bu duruma göre: elimizdeki örneklemin ortalaması, problem için anakütlenin ortalamasından çok uzağa düşen bir büyüklüktedir ve Ho hipotezini kabul edilemez. Demek ki, bu makine hatalı dolum yapmakta, ortalaması 20 kg olan dolumlar gerçekleştirememektedir.
Hipotez sınaması ve güven aralığı
Genel olarak hipotez sınaması ve güven aralığı değişik matematik ve felsefi önerilere bağlı olarak geliştirilmişlerdir. Bu nedenle bu iki çıkarımsal istatistik yöntemini birbiri ile karıştırmamak ve ikisini ayrı olarak ayrı şekilde kullanmak tavsiye edilmektedir.
Fakat yine de bazı istatistik ders kitapları &alpha anlamlılık seviyesine göre iki-yönlü ret alanı bulunan hipotez sınaması problemi çözmekte iken, aralık kestirimi-güven aralığı kavramları kullanarak (1-&alpha) güven seviyeli bir güven aralığı ortaya çıkarmakta; bu güven aralığının alt ve üst sınırlarını sıfır hipotez olarak belirtilen anakütle ortalaması ile karşılaştırmakta ve eğer sıfır hipotez μ değeri güven aralığı alt ve üst değerleri arasında kalırsa sıfır hipotezi kabul etmekte ve dışında kalırsa sıfır hipotezi ret etmektedirler.
Bu çeşit bir "çözüm" (eğer çözüm denilirse), bir olasılık ölçüsü olan "anlamlılık seviyesi" (&alpha) kavramı ile bir olasılık ölçüsü olmayan ile (ama yine notasyonla 1-%alpha şeklinde olan) çokluluk seviyesi olan "güven seviyesi" kavramını karıştırmaya dayanmaktadır. Bu kavram karışıklığının yapılmaması çok daha uygun bir tutum ve yaklaşım olacağı gayet açıktır.
Dipnotlar
Ayrıca bakınız
- Ortalama
- Hipotez sınaması
- Anlamlılık seviyesi
- Güven aralığı
- Sıfır hipotez ve karşıt hipotez
- 1.tür hata ve II.tür hata
- Örnekleme dağılımı
- p-değeri
- Standart normal dağılım
- Student'in t dağılımı
Dış kaynaklar
- İngilizce Wikipedia "Z-test" maddesi: (İngilizce) (Erişme:7.5.2010)
- İngilizce Wikipedia "Student's t-test" maddesi: (İngilizce) (Erişme:7.5.2010)
- Almanca Wikipedia "Gauß-Test" maddesi: (Almanca) (Erişme:7.5.2010)
- Almanca Wikipedia "t-Test" maddesi: (Almanca) (Erişme:7.5.2010)
|
|