Normal dağılım, istatistik ve olasılık teorisinin en temel kavramlarından biridir. Gauss dağılımı veya çan eğrisi olarak da adlandırılan bu dağılım, doğa, toplum ve mühendislik bilimlerinde gözlemlenen pek çok olgunun matematiksel modellemesinde kullanılır. Özellikle biyoloji, ekonomi, psikoloji, mühendislik ve kalite kontrol gibi alanlarda normal dağılım, veri setlerinin davranışını anlamak için başlıca referans noktasıdır.
Tanım ve Matematiksel Yapı
Normal dağılım, sürekli olasılık dağılımlarının bir türüdür ve iki parametre ile tanımlanır: ortalama (µ) ve standart sapma (σ). Bu dağılımın olasılık yoğunluk fonksiyonu şu şekilde ifade edilir:
Burada:
- μ\mu
- μ dağılımın merkezi eğilimini (ortalama) belirtir,
- σ\sigma
- σ ise dağılımın yayılımını (standart sapma) gösterir.
Elde edilen eğri simetrik bir yapıya sahiptir ve maksimum değeri ortalama noktasında bulunur.
Tarihçe
Normal dağılımın temelleri, 18. yüzyılda Abraham de Moivre tarafından atılmış, ardından Carl Friedrich Gauss tarafından geliştirilmiştir. Özellikle astronomi ve ölçüm hatalarının analizi için Gauss’un katkıları, dağılımın bilimsel alanda yaygın kullanımını sağlamıştır. Bu nedenle dağılım, literatürde sıklıkla Gauss Dağılımı olarak da anılır.
Özellikleri
- Simetri: Ortalama, medyan ve mod aynı değerdedir.
- 68-95-99,7 Kuralı: Normal dağılımda, verilerin yaklaşık %68’i ortalamanın bir standart sapma içinde, %95’i iki standart sapma içinde, %99,7’si ise üç standart sapma içinde yer alır.
- Asimptotik Yapı: Eğri, x-eksenine yaklaşır fakat hiçbir zaman kesişmez.
- Merkezi Limit Teoremi: Bağımsız ve aynı dağılıma sahip rassal değişkenlerin ortalamaları, örneklem büyüklüğü arttıkça normal dağılıma yaklaşır.
Kullanım Alanları
- Doğa Bilimleri: İnsan boyu, ağırlığı, ölçüm hataları.
- Sosyal Bilimler: Sınav başarı puanları, gelir dağılımları (yaklaşık).
- Mühendislik: Üretim süreçlerinde kalite kontrol, hata analizi.
- Finans: Getirilerin dağılımı, risk ölçümleri.
Eleştiriler ve Sınırlılıklar
Her ne kadar normal dağılım geniş bir kullanım alanına sahip olsa da, birçok gerçek veri kümesi tam olarak bu dağılıma uymamaktadır. Özellikle aşırı uç değerlerin veya çarpık dağılımların bulunduğu durumlarda normal dağılımın kullanımı yanıltıcı olabilir. Bu durumlarda, log-normal, t-dağılımı veya Pareto dağılımı gibi alternatif dağılımlar tercih edilmektedir.
Normal dağılım, istatistiksel modelleme ve veri analizi için bir temel taşı niteliğindedir. Gerek matematiksel özellikleri gerekse uygulamalı alanlardaki geçerliliği sayesinde, istatistik biliminin en önemli dağılımlarından biri olarak kabul edilmektedir.

