Ortalama
Bu madde veya bölüm Merkezsel Konum Ölçüleri maddesine çok benzemektedir ve bu iki maddenin tek başlık altında birleştirilmesi önerilmektedir. Birleştirme işlemi yapıldıktan sonra sayfaya {{Geçmiş birleştir}} şablonunu ekleyiniz. |
Ortalama veya merkezsel konum ölçüleri, bir veri dizisinin orta konumunu, tek bir sayı ile ifade eden betimsel istatistik ölçüsüdür. Günlük hayatta ortalama dendiğinde genellikle kast edilen aritmetik ortalama olmakla beraber bu ölçünün çok belirli bazı dezavantajları söz konusudur. Bu yüzden matematik ve istatistikte, bir anakütle veya örneklem veri dizisi değerlerini temsil eden tek bir orta değer veya beklenen değer, olarak birçok değişik merkezsel konum ölçüleri geliştirilmiş ve pratikte kullanılmaktadır.
Tarihçe
Ortalama kavramı başlangıçta deniz nakliyatında ortaya çıkan zarar kavramından geliştirilmiştir. Deniz nakliyatında zarar, ya zarar gören eşya sahibi tarafından özel avarya olarak tümüyle yüklenilir veya nakledilen eşyaların satış kârını ortak olarak paylaşanlar tarafından genel avarya ortaklık payına göre karşılanır. Genel avarya hesabının yapılması için geliştirilip kullanılan matematiksel hesaplar aritmetik ortalamanın ilk kullanılma alanı olmuştur. Bu kavrama Arapça avar, Italyanca avaria, Türkçede (pek çok denizcilik terimi gibi İtalyanca'dan alınan) avarya ve İngilizce average adı verilmektedir. İngilizce'de aynı sözcük, ve bazı günlük pratik hallerde Türkçe'de kullanılan averaj sözcüğü ortalamaya eşit anlamda kullanılmaktadır.
İstatistikte bilimsel olarak ortalamalar kavramına bir aksiyomatik yaklaşım J.Bibby (1974) tarafından verilmiştir.[1]
Ortalama tipleri
Ortalama bir sayısal veri dizisininin merkezsel konumunu temsil etmek için seçilen tek bir sayı halinde bir özettir. Eğer veri dizisinde tüm elemanlar aynı sayı ise ortalama bu tek sayıdır. Ancak bu tip veri dizisi pratikte gayet az olarak bulunduğu, hatta nerede ise hiç bulunmadığı için, bir pratik veri dizisinin merkezsel konumunu farklı şekilde temsil edecek ortalamalar geliştirilmiştir. Önce bu ortalamalardan en çok kullanılanları kısaca ele alınacak ve sonra daha geniş kapsamlı bir tablo sunulacaktır.
En çok kullanılan ortalama tipleri
Günlük hayatta en çok kullanılan ortalama türü aritmetik ortalama olmakla birlikte, bazı durumlarda mod, medyan, geometrik ortalama ve diğer ortalama türleri tercih edilmektedir.
Aritmetik ortalama
Aritmetik ortalama bir anakütle veya bir örneklem veri değerlerinin toplamlarının o anakütledeki terim sayısına veya örneklem büyüklüğüne bölünerek elde edilen merkezsel konum değeridir. Bu tanınım şu formülle gösterilir:
Burada örneklem aritmetik ortalaması sembolüdür; anakütle aritmetik ortalaması için μ kullanılır.
Bu yöntem istatistikte sıkça kullanılır. Fakat bazı eksik yönleri vardır.
- Verilerin ölçülme ölçeğinin aralıklı veya oransal olması gerekir. İsimsel ölçekli veriler için aritmetik ortalama anlamsızdır. Birçok istatistikçi sırasal ölçekli veriler için aritmetik ortalamanın anlamsız olduğunu kabul etmektedirler; ancak pratikte, özellikle bir anketten ortaya çıkarılan, sırasal ölçekli veriler için aritmetik ortalama hesaplanıp önemli alanlarda kullanılmaktadır.
- Eğer anakütle veya örneklem veri dağılımı simetrik olmayıp çarpıklık gösteriyorsa, aritmetik ortalama merkezsel değer olmaktan çıkıp çarpıklık kuyruğunun bulunduğu tarafa doğru gitmeye eğilimlidir. Bu halde aritmetik ortalama istatistik bilenlerin istatistik bilmeyenlere karşı kullanabilecekleri bir aldatmaca yolu olarak da kullanılabilir.
Örnek: Bir iş yerinde işçiler maaşlarının düşük olmasından dolayı şikayetçidirler. Fakat yöneticiler tam tersini savunabilirler. Maaş dağılımları şöyle olsun:
- 1 Genel Müdür: 15.000,00 YTL
- 2 tane Genel Müdür Yardımcısı: her biri 5.500,00 YTL
- 5 tane idari işler sorumluları (Halkla ilişkiler, İnsan kaynakları...vb): her biri 1.500,00 YTL
- 30 tane normal personel = her biri 1.000,00 YTL
- Böyle bir durumda maaşların aritmetik ortalaması alınırsa
- [15000+(2x5500)+(5x1500)+(30x1000)]/38 = 1.671,05 YTL
olarak ortalama aylık maaş hesaplanır. Ama bu ortalama merkezsel konumu göstermez. 38 personelden ancak 3'ü ortalamadan fazla maaş almakta görülmektedir ve maaş dağılımı çok bariz şekilde çarpıktır. Çok küçük sayıda kişi (müdür ve 2 yardımcısı) karşılaştırılmalı olarak çok büyük değerde maaş almakta ama çok büyük sayıda kişi düşük değerde maaş almaktadır. Böylece maaş dağılımı gayet asimetrik olup sağda ince uzun bir kuyruk bulunmaktadır; veri dağılımı pozitif çarpıklık göstermektedir. Bu nedenle maaş aritmetik ortalaması merkezsel konum göstergesi olmaktan çıkmıştır.
GRiS
Aritmetik Ortalama'nın Çarpık veri dizilerinde işlevini kaybetmesi durumunun önüne geçebilmek için, 2014 yılında yayınlanan "İstatistikte Altın Oran" Kitabında yeni bir ortalama tanımlanmıştır[2]. Bu yeni ortalama GRiS (Golden Ratio in Statistics) Ortalama olarak adlandırılmıştır. Bu ortalamanın özelliği, veri dizisindeki her bir elemanın, konumuna göre katkı sağlamasıdır.
Veri Dizisi küçükten büyüğe sıralandıktan sonra, her bir elemana bulunduğu konuma göre, yukarıda gösterilen GRiS ortalama katsayı maskesindeki ağırlıklandırma katsayıları atanır. Her bir elemanın Medyan'dan farkı, kendine atanmış ağırlıklandırma katsayısı ile çarpılır, bu çarpımların toplamı, ağırlıklandırma katsayıları toplamına bölünür ve medyandan sapma hesaplanır. Veri dizisinin her iki ucunda bulunan elemanlar, aynı ölçüde baskılandığı için; GRiS ortalama her durumda medyana, aritmetik ortalamadan daha yakın konumlanmaktadır. Bu yöntem sayesinde aritmetik ortalamanın en bariz zayıflığı olan merkezsel değer olmaktan çıkıp çarpıklık kuyruğunun bulunduğu tarafa doğru gitme eğilimi bertaraf edilmiştir.
Geometrik ortalama
Geometrik ortalama bir anakütle veya bir örneklem veri değerlerinin çarpımlarının o anakütledeki terim sayısına veya örneklem büyüklüğüne eşit kökü alınmak suretiyle elde edilen bir merkezsel konum değeridir. Bu tanımlama için formül şöyle verilir:
Burada G geometrik ortalama sembolüdür.
Bu tür ortalamanın da dezavantajları bulunmaktadır:
- Büyük bir sayıda kök almak el hesabı ile imkânsız olduğu için bu tür ortalama genel olarak elektronik hesap makinelerinin veya bilgisayarların gelişmesinden önce kullanılması çok zor olmaktaydı. Verilerin logaritması alınıp bu logaritma verilerinin toplamı bulunduktan sonra eldeki veri büyüklük sayısına bölünerek geometrik ortalamanın logaritma değeri bulunur, bunun antilogaritmasının alınması gerekirdi. Orta basitlikte hesaplar yapabilen elektronik hesap makinaları veya kompüter kullanılarak geometrik ortalama almak çok kolaylaşmıştır.
- Geometrik ortalama bulabilmek için verilerin pozitif değerde olması gerekmektedir yani veri değerlerinin özellikle sıfır veya negatif olmaması gerekmektedir. Eğer tek bir veri değeri sıfır ise, geometrik ortalama almak anlamsız olacaktır.
- Ayrıca verilerin ölçülme ölçeğinin oransal olması gerekir; isimsel ölçekli, sırasal ölçekli ve aralıksal ölçekli veri değerleri için geometrik ortalama anlamsız olur.
Mod
Mod veri dizisi içinde en çok defa tekrarlanan veri değeridir. Mod isimsel ölçekli veriler için anlamlı olan tek ortalama ölçüsüdür. Ancak veri dizisi içinde tek bir mod olmayabilir yahut birden fazla sayıda mod bulunabilir.
Medyan
- Ana madde: Medyan
Medyan bir veri dizisinin küçükten büyüğe veya büyükten küçüğe sıralanmasından sonra bu dizinin tam ortasında bulunan değerdir. Eğer veri büyüklüğü tek sayılı ise medyan verilen bir veri değerine eşit olur. Eğer veri büyüklüğü çift sayılı ise medyan orta iki değerin ortalaması olur. Medyan bulmak için basit bir algoritmaya göre sıralanmış veri değerlerinin kalan en küçük ve en büyük değerleri birer birer elimine edilir; veri sayısı tek ise en son kalan tek veri medyandır; eğer veri sayısı çift ise son kalan iki veri çiftinin ortalaması medyan olur.
Genelleştirilmiş ortalama türleri
İstatistikçiler ortalama türlerini genelleştiren tek bir formül bulmak için değişik yaklaşımlar kullanmışlardır:
- Genelleştirilmiş ortalama formülü şöyle verilir:
Bu formülde m için değişik değerler değişik ortalama türü verirler: :
- eğer m = 1 ise aritmetik ortalama;
- eğer m = 2 ise kuadratik ortalama;
- eğer m = -1 ise harmonik ortalama;
- limit m → 0 ise geometrik ortalamaya yaklaşır.
- Genelleştirilmiş f-ortalaması formülü diğer bir örnektir. Genelleştirilmiş f-ortalaması için formül şudur:
Burada f tersi alınabilir bir fonksiyondur. Bu formül değişik ortalamalar için şu şekilleri alır:
- Geometrik ortalama için f(x)=log x olur.
- Harmonik ortalama için f(x)= 1/x olur.
- Çok az bilinen üstel ortalama için f(x)=ex olur.
Ancak bu genelleştirme ile tüm ortalamaların ayrı ayrı formüllerini bulmak imkânsızdır.
- Diğer bir genelleştirme, ortalamalar listesi elamanlarının permütasyonu halinde simetrik olan bir g(x1, x2, ..., xn) fonksiyonunun değişik şekillerde ifadesi ile yapılır:[3]
- Aritmetik ortalama için g(x1, x2, ..., xn) =x1+x2+ ...+ xn.
- Geometrik ortalama için g(x1, x2, ..., xn) =x1·x2· ...· xn.
- Harmonik ortalama için g(x1, x2, ..., xn) =x1−1+x2−1+ ...+ xn−1.
Değişik ortalama tipleri özeti
İstatistik bilim dalında bir sıra değişik ortalama tipleri geliştirilmiş ve bunlardan araştırıcının isteğine göre birinin veya birkaçının eldeki veriler için merkezsel konum ölçüsü olarak kullanılması imkanı sağlanmıştır.
İsim | Denklem veya betimleme |
---|---|
Aritmetik ortalama | |
Medyan (ortanca) | Bu yüksek değerde olan veriler ile düşük değerde olan verilerin tam ortasında bulunan bir sayı. |
Geometrik medyan | Rn düzeyindeki noktalar için, medyan kavramının, matematik rotasyon dönüşümünde sabit kalan bir genişletilmesi, |
Mod (tepedeğer) | Verilerin en çok defa tekrarlanmış değeri |
Geometrik ortalama | |
Harmonik ortalama | |
Kuadratik ortalama (veya ortalama kareler karekökü) | |
Genelleştirilmiş ortalama | |
Ağırlıklı ortalama | |
Kesilmiş ortalama | Belirli bir yüzde oranda en yüksek ve en düşük veri değerlerinin bertaraf edilmelerinden sonra hesaplanan aritmetik ortalamadır. |
Çeyrekler açıklığı ortası | Çeyrekler açıklığı kullanılarak kesilmiş ortalamanın özel bir hali. |
Açıklık-ortası | |
Winsorize ortalaması | Bir çeşit kesilmiş ortalama olup belirli bir yüzde olarak kesilen en yüksek ve en düşük değerler bertaraf edileceğine kalan sayılar için en yuksek ve en düşük veri değerleri yerine ikame edilirler. |
Anualizasyon |
Ayrıca bakınız
Kaynakça
- ↑ Bibby, J. (1974) "Axiomatisations of the average and a further generalization of monotonic sequences" Glasgow Mathematical Journal C.15, say.63–65.
- ↑ Mehmet Güven GÜNVER, Prof. Dr. Mustafa Şükrü ŞENOCAK, Doç Dr. Suphi VEHİD, İstatistikte Altın Oran, Türkmen Kitabevi, 2014, ISBN : 9786054749409
- ↑ Bakın Bibby,J. (1974) "Axiomatisations of the average and a further generalisation of monotonic sequences", Glasgow Mathematical Journal, C.15, say. 63–65,
Dış bağlantılar
- Bütün örneklem gözlemlerinin ağırlıklı ortalaması olan medyan
- İki değer için aritmetik ortalama ve geometrik ortalama hesaplanması ve karşılaştırılması
- Mod, medyan, ortalama ve standart sapma hesaplayabileceğiniz Türkçe bir sayfa.
|