K-En Yakın Komşu (KNN) algoritması, hem sınıflandırma hem de regresyon problemleri için kullanılabilen, denetimli öğrenmeye dayalı bir tembel öğrenme yöntemidir. KNN algoritması, parametre tahmini veya karmaşık model eğitimi gerektirmemesi bakımından literatürde parametrik olmayan bir yaklaşım olarak tanımlanır. Bu yöntem, tüm eğitim örneklerinin bellekte tutulmasına dayanır ve tahmin süreci, sorgu örneği ile eğitim örnekleri arasındaki mesafelerin hesaplanması yoluyla gerçekleştirilir. Bu bağlamda KNN, örnek tabanlı öğrenme yöntemleri arasında yer alır.
KNN algoritması, basit olmasına rağmen çeşitli güçlü yönlere sahiptir:
KNN algoritmasının temel işleyişi aşağıdaki aşamalara ayrılabilir:
K değeri, algoritmanın genelleme performansını doğrudan etkileyen kritik bir hiperparametredir. Genellikle ikili sınıflandırma problemlerinde eşit oy durumlarını önlemek amacıyla tek sayılar (ör. 3, 5, 7) tercih edilir.
Örnekler arası benzerlik veya uzaklık, seçilen uygun bir mesafe metriği ile hesaplanır. Uygulama bağlamına göre çeşitli metrikler kullanılabilir:
Sorgu noktasına (test örneğine) olan tüm mesafeler hesaplanır, artan düzende sıralanır ve en yakın k komşu seçilir.
KNN algoritmasının başarımı, k parametresi ve mesafe ölçüm yönteminin doğru seçimine bağlıdır. Genel eğilimler şu şekilde özetlenebilir:
Ayrıca, özelliklerin ölçeklendirilmesi (ör. z-puanı standardizasyonu veya min-max dönüşümü) mesafe hesaplarının adil olması açısından kritik öneme sahiptir. Aksi durumda, geniş değer aralığına sahip özellikler mesafe ölçümünü tek başına domine edebilir ve modelin önyargılı sonuçlar üretmesine sebep olabilir.
Aşağıdaki Python örneği, KNN algoritmasının pratikte nasıl kullanılabileceğini göstermektedir. Örnek çalışmada, Iris veri kümesi üzerinde farklı k değerleri test edilerek en uygun parametre, çapraz doğrulama yöntemiyle belirlenmektedir:
Örnek Çıktı:
Henüz Tartışma Girilmemiştir
"K-En Yakın Komşu Algoritması" maddesi için tartışma başlatın
Avantajları
Çalışma Prensipleri
1.Adım - Komşu Sayısının Seçilmesi (k)
2.Adım - Mesafe Ölçümü
3.Adım - Komşuların Belirlenmesi
4.Adım - Tahmin Üretimi
Mesafe Ölçümü Seçimi ve Parametre Hassasiyeti
Uygulamalı Örnek: Iris Veri Kümesinde KNN Sınıflandırması