Destek Vektör Makineleri

+1 Daha

Kaydet

Paylaş

Alıntıla

Destek Vektör Makineleri (Support Vector Machines-SVM), denetimli öğrenme (supervised learning) yöntemlerinden biridir ve hem sınıflandırma (classification) hem de regresyon (regression) problemlerinde kullanılır. SVM, özellikle yüksek boyutlu veri setlerinde etkili bir şekilde çalışabilen güçlü bir makine öğrenmesi algoritmasıdır. Temel amacı, veriyi sınıflandırmak veya ayırmak için optimal bir hiperdüzlem (optimal hyperplane) bulmaktır.

Tanımı
Destek vektör makineleri literatürde, hem sınıflandırma hem de regresyon analizinde kullanılmasına rağmen genel olarak sınıflandırma işlemlerinde daha çok tercih edilen bir makine öğrenme yöntemidir. Bu yöntem denetimli bir öğrenme modeline dayanmaktadır. Algoritmanın çalışması esnasında verilerin türüne bağlı olarak çekirdek fonksiyonlarda kullanılabilmektedir. Bu sayede hem doğrusal hem de doğrusal olmayan sınıflandırma işlemlerini gerçekleştirilebilmektedir. Eğer sınıflandırma işleminde, tam ayrıştırılabilir veriler kullanılırsa genellikle tüm veriler bir hiper düzlem ile sınıflandırılabilmektedir. Fakat, eğer tam ayrıştırılamayan veriler kullanılırsa, çoğunlukla aynı boyutta tek bir düzlem ile sınıflandırılamamaktadır. Bu nedenle de farklı çekirdek fonksiyonları kullanılmaktadır.

Çalışma Mantığı
SVM'nin çalışma mantığı şu adımlara dayanır:

1- Veri Dönüşümü:
SVM, veriyi daha yüksek boyutlu bir uzaya dönüştürür (örneğin, kernel fonksiyonları kullanarak). Bu, doğrusal olarak ayrılamayan verilerin doğrusal olarak ayrılabilir hale gelmesini sağlar.

2- Hiperdüzlem Bulma:
SVM, iki sınıf arasında en geniş marjine sahip olan hiperdüzlemi bulur. Bu hiperdüzlem, sınıfları en iyi şekilde ayıran sınırdır.

3- Destek Vektörleri:
Hiperdüzleme en yakın olan veri noktalarına destek vektörleri denir. Bu noktalar, modelin karar sınırını belirler.

4- Kernel Trick (Çekirdek Hilesi):
Doğrusal olarak ayrılamayan veriler için, SVM kernel fonksiyonları kullanır. Yaygın kernel fonksiyonları şunlardır:

Doğrusal Kernel: K(x,y)=xTy
Polinom Kernel: K(x,y)=(xTy+c)d
Radyal Tabanlı Fonksiyon (RBF) Kernel: K(x,y)=exp⁡(−γ∥x−y∥2)
Sigmoid Kernel: K(x,y)=tanh⁡(αxTy+c)

5- Optimizasyon:
SVM, bir ikinci dereceden programlama (quadratic programming) problemi çözerek hiperdüzlemi bulur. Bu, sınıflar arasındaki marjini maksimize ederken sınıflandırma hatasını minimize eder.

Kullanım Alanları
Metin Sınıflandırması: Spam e-posta tespiti, duygu analizi ve belge kategorizasyonu gibi problemlerde kullanılır.
Görüntü Sınıflandırması: Nesne tanıma, yüz tanıma ve tıbbi görüntü analizi gibi alanlarda etkilidir.
Biyoinformatik: Protein yapısı tahmini, gen ekspresyonu analizi ve hastalık teşhisi gibi problemlerde kullanılır.
Finansal Tahminler: Hisse senedi fiyat tahmini, kredi skorlama ve risk analizi gibi alanlarda kullanılır.
El Yazısı Tanıma: Posta kodlarının tanınması veya el yazısı karakterlerin sınıflandırılması gibi uygulamalarda kullanılır.

Destek Vektör Makinelerinin iki boyutta temsili gösterimi
Destek Vektör Makinesi Algoritması Kullanılarak Iris Veri Seti Üzerinde Uygulama Örneği

Veri setinde bulunan özelliklerden Sepal Uzunluk ve Sepal Genişlik türleri üzerinden türler arasındaki korelasyonları gözlemlemek için özelliklerin dağımı incelenir.

Özelliklerin grafik üzerinde görselleştirilmesi:

Aynı şekilde, veri setinde bulunan özelliklerden Petal Uzunluk ve Petal Genişlik dağılımı incelenir.

Özelliklerin grafik üzerinde dağılımı:

Çiçeğin ait olduğu sınıfın türünü tahmin etmek için ilk iki özelliği (Sepal Uzunluk ve Sepal Genişlik) kullanarak br SVM modeli oluşturulur.

Oluşturulan yapı için lineer ve lineer olmayan modellemeler üzerinden çekirdek işlemleri gerçekleştirilir.

Sınıflandırma modelleri görselleştirildiğinde aşağıdaki grafikler elde edilir.

Farklı Gama (γ) değerleri (0.1, 1, 10, 100) üzerinden çeşitli çekirdekleri gözlemleyerek hiperparametre ayarı oluşturulur. 

Elde edilen grafiklerde gama değeri arttıkça model uyumunda artış gözlemlenmektedir.


Avantaj ve Dezavantajları
Düşük ölçekli-kapasiteli veri kümeleri için çok hızlı ve doğruluk oranı yüksek bir yöntemdir.
Büyük veri kümelerinde eğitim verisi üzerindeki işleme süresi yüksek olduğundan sonuç çıktısı uzun sürmektedir.
Doğrusal ve Doğrusal Olmayan veri kümeleri için uygulanabilir.
İç-içe veri kümelerinde düşük oranda etkili ve hassas olduğundan doğruluk oranları düşüktür.
Yüksek boyutlu veri kümelerinde sonuç odaklı olarak etkili bir çözümdür.
Düşük bir iyileştirme-bakım (Gama/C) ile yüksek doğruluk değerlerine ulaşılabilir. 
Çekirdekleme (Kernel Trick) işlemlerinde yüksek ölçüde zaman kaybı oluşturmaktadır.

Kaynakça

Ozturk, M. " Python ile Sınıflandırma Analizleri - Destek Vektör Makineleri", 2021. https://miracozturk.com/python-ile-siniflandirma-analizleri-destek-vektor-makinasi-dvm/

Kayaalp, K. Metlek, S. Makine Öğrenmesinde, Teoriden Örnek Matlab Uygulamalarına Kadar Destek Vektör Makineleri. İksad Yayıncılık. Ankara, 2020. 

Scikit-learn. "Support Vector Machines." https://scikit-learn.org/1.5/modules/svm.html

IBM. "What are support vector machines?." https://www.ibm.com/think/topics/support-vector-machine

GeekforGeeks. "Support Vector Machine Algorithm", 2025. https://www.geeksforgeeks.org/support-vector-machine-algorithm/

Sen de Değerlendir!

0 Değerlendirme

Yazar Bilgileri

YazarBeyza Nur Türkü28 Ocak 2025 07:54

Etiketler

#Hiperdüzlem #Kernel Fonksiyonları #Destek Vektör Makineleri #Sınıflandırma #Makine Öğrenmesi

Tartışmalar

Henüz Tartışma Girilmemiştir

"Destek Vektör Makineleri" maddesi için tartışma başlatın

Tartışmaları Görüntüle

İçindekiler

Tanımı
Çalışma Mantığı
Kullanım Alanları
- Destek Vektör Makinesi Algoritması Kullanılarak Iris Veri Seti Üzerinde Uygulama Örneği
- Avantaj ve Dezavantajları