Poisson dağılımı
Olasılık kütle fonksiyonu Yatay eksen indeks k . Fonksiyon yalnızca k'nın tamsayı değerleri için geçerlidir. Noktaları bağlayan çizgiler süreklilik göstermez; kullanıcıya yardımcı olmak üzere çizilmişlerdir. | |
Yığmalı dağılım fonksiyonu Yatay eksen indeks k . | |
Parametreler | |
---|---|
Destek | |
Olasılık kütle fonksiyonu (OYF) | |
Yığmalı dağılım fonksiyonu (YDF) |
(burada Tamamlanmamis gamma fonksiyonu olur) |
Ortalama | |
Medyan | yaklaşık olarak |
Mod | ve eğer bir tamsayı ise |
Varyans | |
Çarpıklık | |
Fazladan basıklık | |
Entropi |
(büyük değeri için) |
Moment üreten fonksiyon (mf) | |
Karakteristik fonksiyon |
Poisson dağılımı, (okunuşu: puason dağılımı) olasılık kuramı ve istatistik bilim kollarında bir ayrık olasılık dağılımı olup belli bir sabit zaman birim aralığında meydana gelme sayısının olasığını ifade eder. Bu zaman aralığında ortalama olay meydana gelme sayısının bilindiği ve herhangi bir olayla onu hemen takip eden olay arasındaki zaman farkının, önceki zaman farklarından bağımsız oluştuğu kabul edilir.
Poisson dağılımı çok kere belirli sabit zaman aralığı birimleri bulunan problemlere uygulanmakla beraber, diğer birimsel aralıklı problemlere de (yani birim uzaklık, alan veya hacim içeren problemlere de) başarı ile uygulanabilir.
Örnekler
Poisson dağılımı Poisson süreci ile birlikte ortaya çıkar. Poisson süreci aralıklı karakterde olan (yani 0, 1, 2, 3 .. kere meydana çıkan) bazı olgularin bir birim zaman, alan, mekân veya hacimde sabit bir olasılıkla oluşması şekilini alır. Bu çeşit olaylara ve Poisson dağılımının uygulanmasına örnekler şunlardır:
- Prusya süvari birliklerinde her bir yıl at ve katır tepmeleri ile ölen asker sayısı: Bu klasik örnek 1868'de Ladislaus Josephovich Bortkiewicz tarafından bir kitapta yayınlanmış ve çok tanınmış bir örnek olarak yıllarca askeri ve sivil yüksek okul öğrencilerine verilmiştir.
- Bir saat aralığında belli bir Internet sitesine gelen bağlantılar sayısı;
- Yarım saat içinde bir nakliyat deposuna yükleme-boşatılma için gelen kamyon sayısı;
- Her bir beş dakika içinde bir telefon cevap merkezine gelen telefonlar sayısı;
- Belli bir trafik kavşağından 1 dakika içinde geçen otomobil sayısı;
- Belli bir zaman aralığında bir büyük binada yanıp çalışması duran florasan lambalarının sayısı;
- Bir mucit kişinin çalışma hayatı boyunca patentini aldığı keşifler sayısı;
[Not: Birbirini takip eden Poisson tipi olaylar arasındaki aralık karşılıklı ilişkili olarak bir üstel dağılım olur. Örneğin, bir florans ampülünun çalışma süresi veya otobüslerin gelmesi arasındaki bekleme zamanı.]
Tarihçe
Bu dağılım ilk defa Siméon-Denis Poisson (1781–1840) tarafından diğer olasılık hakkındaki yazıları ile birlikte 1838'de yayınlanan Recherches sur la probabilité des jugements en matières criminelles et matière civile ("Ceza hukuku ve medeni hukuk alanlarındaki hükümlerin olasılığı üzerinde araştırmalar") adındaki eserinde ortaya atılmıştır.
Nadir olaylar için Poisson dağılımı
Poisson dağılımının genel odaklandığı rassal değişken bir sayılabilen olaydır; bu olay belli bir sabit uzunlukta olan (genellikle zaman) aralıkta ayrık olarak ortaya çıkar ve bu aralıkta gözlenen olayların sayısı Poisson dağılım için rassal değişkendir. Bu sabit aralıkta ortaya çıkan olaylar sayısının beklenen değeri (ortaya çıkmanın ortalama sayısı) λ olarak sabittir ve bu ortalama değer aralık uzunluğuna orantılıdır. Eğer her 4 dakikalık zaman aralığı içinde ortalama 5 olay meydana geliyorsa, sabit 8 dakikalık aralıkta ortalama 10 (=8x5/4) olay ortaya çıkar. Herhangi bir negatif olmayan bir tam sayı olan k sayıda (k = 0, 1, 2, 3...) olay ortaya çıkma olasılığı şöyle ifade edilir:
burada
- e, doğal logaritmanın tabanı (e = 2.71828...);
- k, olasılığı fonksiyon ile verilmekte olan olayın ortaya çıkma sayısı;
- k!, k için faktöriyel
- λ verilen sabit aralıkta ortaya çıkma sayısının beklenen değeri; bir pozitif gerçel sayı.
Bu k'nin fonksiyonu Poisson dağılım için olasılık kütle fonksiyonu olur.
Poisson dağılımı için λ parametresi yalnızca beklenen değer, yani ortaya çıkan sayıda olay için bir ortalama, değildir. Aynı zamanda
yani varyans da olur. Böylece gözlenen olay meydan çıkış sayısı bir ortalama değer λ ile bir standart sapması olması niteliklerini taşiyan bir olasılık dağılımı, Poisson dağılımı, göstermektedir.
Genellikle bir Poisson dağılımı büyük sayıda olay ortaya çıkabilmesi mümkün olduğu, ama bu ortaya çıkması mümkün olayların nadir olduğu kabul edilen, sistemlerde uygulanabilir. Bilimsel alanlarda klasik örnekler atomların nükleer parçalanması; verilen bir DNA zincirinde ortaya çıkan mutasyon sayısı vb. Bu örneklerle ve diğer birçok örneğin için, ortaya çıkan nadir olay sayısı ayrık denemelerin sonucudur ve daha kesinlikle bir binom dağılım kullanılarak model haline getirebilinirler. Fakat n ve λ/n parametreli bir binom dağılımı (yani her deneme için λ/n başarı olasılığı olan n sayıda deneme için belirli bir başarı sayısı için olasılık dağılımı), deneme sayısı n büyüyüp limitte sonsuzluğa yaklaştıkça, beklenen değeri λ olan bir Poisson dağılıma yakınsalaşır. Bu limit bazan nadir olaylar kuralı olarak anılmaktadır. Bu ifade bir bakıma yanıltıcıdır; çünkü birçok Poisson dağılımı ile modellenebilen olaylar arasında birçoğu (örneğin bir otobüs durağına yarım saat aralığında gelen otobüs sayısı; bir mobil telefona bir saat aralığında gelen çağrı sayısı gibi) hiç de nadir olmayan olaylar bulunur. Ancak binom dağılımının büyük sayılar için hesaplanması faktöriyel sayılar kullanılması gerektirdiği için, bu uzun hesaplama biraz sıkıcı görülebilmekte ve bu nedenle Poisson dağılımı yaklaşık olarak binom dağılım yerine kullanılmaktadır.
Binom dağılımından limitte Poisson dağılım olasılık kütle fonksiyonunun çıkartılmasınin matemetiksel kanıtı şöyle yapılır:
Önce, değişkenler hesabı (calculus) içinde kullanılan limitin şöyle ifade edildiğı hatırlanır:
p = λ/n eşitliği bu ifade içine konulursa, şu genel denkleme varılır:
Şimdi bu son ifade biraz daha açılır ve şu elde edilir:
Limitte, ilk parantez içindeki ifade 1 e yakınsama gösterir (yani n ∞'a yaklaştıkça, ilk parantezdeki ifade 1'e yakınsar ) ve ikinci parantez içindeki ifade, ifade içinde n olmaması nedeniyle, sabit kalır; üçüncü parantez içindeki ifade e−λ değerine yakınsar ve son olarak da dördüncü parantezdeki ifade, 1 e yakınsar. Sonuçta, limitte şu ortaya çıkar:
Daha genel olarak, n ve pn parametreleri olan binom rassal değişkenler için bir sıra Binom ifadesi
olursa, bu seri dağılımda ortalaması λ olan bir Poisson rassal değişkeni için serilere yakınlaşır.[1].
Özellikler
- Poisson dağılımı gösteren rassal bir değişken için beklenen değer ve varyans değeri de λdır. Poisson dağılımının yüksek momentleri λ terimleri ile oluşan (matematiksel kombinatorik kuramında anlamlı olan katsayıları bulunan) Touchard polinomlarıdır. Eğer Poisson dağılımı için beklenen değer 1 ise, o zaman Dobinski'nin formülüne göre ninci moment n büyüklüğünde olan set bölünümlerinin sayısına eşittir.
- Tam sayılı olmayan bir λ lambda parametreli Poisson dağılımı gösteren bir rassal değişkenin mod değeri, λ 'dan küçük olan en büyük pozitif tam sayıya, yani 'ya, eşittir.
- Poisson dağılımı gösteren rassal değişkenlerin toplamı:
- Eğer ifadesi parametresi ile Poisson dağılımı gösteriyor ve terimleri bağımsız iseler, o halde
ifadesi de parametresi toplama katılan parametre toplamlarından olan bir Poisson dağılımı gösterir.
- Beklenen değeri λ olan Poisson dağılımınin moment üreten fonksiyonu şu ifade ile verilir:
- Poisson dağılımı için tüm kümülantlar beklenen değer olan λya eşittirler. Poisson dağılımı için ninci faktöriyel moment λn olur
- Poisson dağılımlari sonsuz olarak bölünebilir olasılık dağılımlarıdır.
- Poi(λ0) ile Poi(λ) arasındaki yönlendirilmiş Kullback-Leibler ayrılımı şöyle ifade edilir;
Poisson dağılımı ile üretilen rassal değişkenlerin simulasyonu
Poisson dağılımlı rassal sayıları üretmek için en basit yollardan birisi Knuth tarafından aşağıdaki gibi bir bilgisayar algoritmasıyla verilmiştir[2]:
algoritma poisson rassal sayı üretimi (Knuth): init: Let L ← e−λ, k ← 0 and p ← 1. do: k ← k + 1. [0,1] aralığı içinde birörnek dağılımlı rassal sayı u üret ve let p ← p × u. while p ≥ L. return k − 1.
Basit olmakla beraber, karmaşıklık λ ile doğrusal olarak oranlıdır. Bu sorun etkisini azaltmak için çeşitli diğer algoritmalar geliştirilmiştir.[3][4]
İlişkili dağılımlar
- Eğer ve ise, o halde farkı bir Skellam dağılımı gösterir.
- Eğer ve bağımsızlarsa ve ise, o zaman ya koşullu dağılımı, bir binom dağılımı olur. Özellikle, olur. Daha genel olarak, eğer X1, X2,...,Xn rassal değişkenleri, parametreleri
λ1, λ2,..., λn olan Poisson dağılımı gösteriyorlarsa, o zaman . - Eğer denemeler sayısı limitte sonsuza doğru yaklaşır ve başarı sayısının beklenen değeri sabit kalırsa, bu binom dağılım limitte Poisson dağılıma yaklaşacağı isbat edilmiştir. Bu nedenle Poisson dağılım, eğer n yeterce büyük ve p yeterce küçük ise, bir binom dağılım yerine yaklaşım olarak kullanılabilir. Alışılagelen bir kurala göre, eğer n en aşağı 20 ise ve p 0,05e eşit veya daha küçük ise, Poisson dağılımı binom dağılımının iyi bir yaklaşımı olacaktır. Bu kurala göre eğer n ≥ 100 ve np ≤ 10 ise, bu yaklaşım mükemmel olur.[5]
- Yeter derecede yüksek λ değeri (diyelim λ>1000) için, ortalaması λ ve varyansı λ olan bir normal dağılım, Poisson dağılım için çok iyi bir yaklaşım olur. Eğer λ 10dan biraz büyük ise, bu halde normal dağılım ancak uygun bir süreklilik doğrulaması kullanılırsa uygun bir yaklaşım olabilir. Başka bir deyim ile, eğer P(X ≤ x) ifadeleri P(X ≤ x + 0.5) ile değiştirilirse
- olur.
- Eğer bir sabit zaman aralığı içinde bir hizmet alanına gelenler sayısı, ortalaması olan bir Poisson dağılımına uygun ise, o halde gelişler-arası zaman aralıkları, oran parametresi olan, bir üstel dağılım gösterir.
Parametre tahmini
Maksimum olabilirlik
ki için n tane ölçülmüş değer kapsayan bir örneklem alınsın. Bu örneklemin kökenindeki Poisson dağılım gösteren anakütle için Poisson parametresi olan λ için bir uygun bir kestirim değeri bulunması hesaplama hedefidir.
Bu kestirimi maksimum değişebilirlik yöntemi ile bulmak için önce bir log-değişebilirlilik fonksiyonu şöyle biçimlendirilir:
λ ile L fonksiyonunun türevi alınıp bu türev sıfıra eşitlenirse
ifadesi ortaya çıkar. λ için çözüm yapılırsa λ için maksimum-olabilirlilik kestirimini(MOK) şöyle buluruz:
Her gözlem için ortalama λ olduğu için bu ifadenin beklenen değeri de λ olur. Bu nedenle bu kestirim λ için bir yansiz kestirim olur. Bunun kestirim varyans değeri Cramer-Rao alt sınırına ulaşıp geçtigi için, bu kestirim bir etkin kestirim de olur.
Bayes tipi çıkarımsal analiz
Bayes tipi çıkarımsal analiz için Poisson dağılımının oran parametresi olan λ için eşlenik öncel bir gamma dağılımı gösterir. Şu ifadeye göre
λnin bir Gamma olasılık yoğunluk fonksiyonuna göre dağılım gösterdiğini; gnin bir şekil parametresi olan α ile bir ters ölçek parametresi olan β ile parametrelenmiş oldugunu, şöyle gösterilsin:
O zaman, daha önce olduğu gibi n sayıda ölçülmüş değerden oluşan örneklem ki ve bir Gamma(α, β) dağılımlı önsel verilmiş ise, sonsal dağılım şu olur:
Sonsal ortalama olan E[λ] limitte doğru gittikçe maksimum olabilirlik kestirimi olan ifadesine yaklaşır.
Eklecek verilerin sonsal kestirimci dağılımı bir Gamma-Poisson dağılım yani bir negatif binom dağılımı olur.
Küçük sayılar kuralı
Kural sözcüğü istatistik bilimi içinde olasılık dağılımı kavramı ile eşanlamlı olarak kullanılmaktadır. Kurala göre yakınsama kavramı dağılımda yakınsama ile aynı anlamda kullanılmaktadır. Buna dayanarak Poisson dağılımı bazan küçük sayılar kuralı olarak anılmaktadır. Buna neden bu dağılımın, nadir olacağı kabul edilmekle beraber, birçok fırsatta ortaya çıkabilen bir olayın ortaya çıkma sayısını açıklayan olasılık dağılımı olmasıdır. 1898de Ladisladus Bortkiewicz'in Poisson dağılımı hakkında yayınladığı kitabın adı Küçük Sayılar Kuralıdır. Bazı matematik tarihçileri buna ithafen Poisson dağılımının adının da Bortkiewicz dağılımı olmasını istemişlerdir.[2]
Ayrıca bakınız
- Bileşik Poisson dağılımı
- Tweedie dağılımı
- Poisson süreci
- Poisson regresyonu
- Poisson dağılımı tablosu
- Kuyruk kuramı
- Erlang dağılımı n sayıda olayın tümüyle ortaya çıkmasına kadar bekleme zamanlarını tanımlar. Zaman içinde dağılım gösteren olaylar için Poisson dağılımı, daha önceden aralığı sabit olarak tayin edilmiş zaman birimi içinde ortaya çıkan olay sayısını verir; Erlang dağılımı ise ninci olayın olup bitmesine kadar geçen zamanının olasılık dağılımını inceler.
- Skellam dağılımı: Mutlaka ayni asıl dağılımdan ortaya çıkmayan iki Poisson değişirin farkının dağılımını verir.
- Tamamlanmamış gamma fonksiyonu: Yığmalı olasılık fonksiyonunun hesaplanması için kullanılır.
- Dobinski'nin formülü: Poisson dağılımı için momentlerin kombinatrik hesapla yorumlanması.
- Schwarz formülü
- Robbins ön kuramı: Empirik Bayes yönteminin Poisson dağılıma bağlı olduğunu gösteren bir ön kuram.
Referanslar
- ↑ Daha fazla ayrıntı için nadir olaylar kuralı maddesine bakınız.
- ↑ Donald E. Knuth (1969) Seminumerical Algorithms: The Art of Computer Programming, Volume 2, Addison Wesley.
- ↑ Joachim H. Ahrens ve Ulrich Dieter (1974) "Computer Methods for Sampling from Gamma, Beta, Poisson and Binomial Distributions" Computing C.12 No.3 say.223-246 doi=10.1007/BF02293108.
- ↑ Joachim H. Ahrens ve Ulrich Dieter (1982) "Computer Generation of Poisson Deviates" ACM Transactions on Mathematical Software C.8 No.2 say.163-179 doi=10.1145/355993.355997.
- ↑ NIST/SEMATECH, '6.3.3.1. Sayımlar için kalite kontrol grafikleri', e-Handbook of Statistical Methods, 25 Ekim 2006'da bakıldı.
Dış bağlantılar
Online vizülizasyon aletleri
İnternet siteleri
- Poisson Dağılımı Hesaplama
- Kuyruk kuramı için temel bilgiler
- M/M/1 tipi kuyruk sistemi
- Mühendislik İstatistiği Elkitabı: Poisson dağılımı
- QWiki'de Poisson dağılımı
- Poisson Türetilmesi 1: Bir Binom dağılımı için sürekli limit
- Poisson Türetilmesi 2: Üretici fonksiyon yaklaşımı
- Poisson Türetilemsi 3: Bekleme-zamanı dağılımının toplamı
- PoissoNed! Spor için olasılık hesaplayıcısı
- xkcd Poisson dağılımı kapsayan bir web-komik.
|
|