Xception, derin öğrenmede görüntü sınıflandırma alanında yaygın olarak kullanılan bir konvolüsyonel sinir ağı (CNN) mimarisidir. Google tarafından 2017 yılında önerilen bu yapı, “Extreme Inception” (uç noktadaki Inception) anlamına gelir ve Inception mimarisinden esinlenerek geliştirilmiştir. Xception mimarisi, özellikle derin ayrık konvolüsyon (depthwise separable convolution) prensibine dayalı olmasıyla dikkat çeker. Bu yapı, daha düşük parametre sayısıyla daha yüksek performans elde etmeye olanak tanır.
Xception Mimarisi
Xception, temel olarak standart konvolüsyon katmanlarının yerine derin ayrık konvolüsyonlar kullanarak bilgi işleme sürecini daha modüler ve verimli hâle getirir. Bu yapı, her bir kanalın ayrı ayrı filtrelenip ardından birleştirilmesi esasına dayanır.
Xception Mimarisi (Kaynak = Annals of Operation Research (Picture 4))
Derin Ayrık Konvolüsyonlar
Derin ayrık konvolüsyonlar, iki aşamalı bir işlemden oluşur:
- Depthwise Convolution: Her kanal kendi filtresiyle ayrı ayrı işlenir. Bu adımda uzaysal boyutlarda filtreleme yapılır.
- Pointwise Convolution: 1x1 konvolüsyonlar aracılığıyla farklı kanallar arası etkileşim sağlanır. Bu, kanal boyutlarını yeniden düzenler.
Bu iki adım, klasik konvolüsyonun yaptığı işlemleri daha verimli bir şekilde simüle eder.
Xception'in Yapısal Özellikleri
Xception, 36 adet konvolüsyon katmanından oluşur. Bu katmanlar üç temel bloğa ayrılır:
- Giriş Bloğu (Entry Flow): Girdiyi düşük boyutlu temsillere dönüştürür. İki standart konvolüsyon katmanıyla başlar ve ardından üç adet derinlik ayrılabilir konvolüsyon bloğu içerir. Bu aşamada, giriş görüntüsünden temel kenar ve doku bilgileri çıkarılırken, boyut küçültülerek sonraki aşamalar için işlem yükü azaltılır.
- Orta Akış (Middle Flow): Xception mimarisinin asıl öğrenme bölümüdür. Bu blok, 8 kez tekrar eden yapılar içerir ve her yapıda üç adet derinlik ayrılabilir konvolüsyon ile bir artık bağlantı bulunur. Bu tekrarlar sayesinde model, daha karmaşık ve soyut özellikleri öğrenebilir. Orta akış bloğunun tekrarlayan yapısı, modelin derinliğini artırarak daha güçlü temsiller üretmesine yardımcı olur.
- Çıkış Bloğu (Exit Flow): Öğrenilen özelliklerin sınıflandırma işlemi için daha yoğun temsillere dönüştürüldüğü bölümdür. Bu kısımda da derinlik ayrılabilir konvolüsyonlar ve artık bağlantılar birlikte kullanılır. Bu bloktan sonra genellikle küresel ortalama havuzlama (global average pooling) katmanı ve ardından tam bağlantılı (fully connected) katman gelir.
(a) Standart CNN (b) Derinlik Yönün Ayrılabilir CNN (Kaynak = Amin Hossein Panahi)
Xception mimarisi, derin ayrık konvolüsyonları kullanarak klasik konvolüsyonlara kıyasla daha verimli özellik çıkarımı sağlar.
Kullanım Alanları
Xception mimarisi, başta ImageNet olmak üzere çeşitli görüntü sınıflandırma ve nesne tespiti görevlerinde başarıyla kullanılmaktadır. Özellikle MobileNetV2 ve EfficientNet gibi modellerde de benzer ayrık konvolüsyon prensipleri tercih edilmiştir. Kullanıldığı başlıca alanlar şunlardır:
- Görüntü sınıflandırma
- Tıbbi görüntü analizi
- Video analiz
- Endüstriyel kalite kontrol
- Transfer öğrenme tabanlı modeller