EfficientNet, görüntü sınıflandırma görevlerinde yüksek doğruluk sağlamakla birlikte hesaplama maliyetini minimumda tutmayı amaçlayan bir derin öğrenme mimarisidir. İlk olarak 2019 yılında Google AI tarafından tanıtılan EfficientNet ailesi, hem doğruluk hem de verimlilik açısından önceki konvolüsyonel sinir ağı (CNN) mimarilerine göre önemli gelişmeler sunmuştur. Modelin temelinde, derinlik (depth), genişlik (width) ve çözünürlük (resolution) olmak üzere üç temel ölçütün dengeli biçimde ölçeklenmesi yatmaktadır.
Verimli Ölçekleme Stratejisi
EfficientNet, CNN mimarilerinde yaygın olan tek boyutlu ölçekleme stratejilerinin aksine, eşzamanlı çok boyutlu ölçekleme (compound scaling) yöntemi sunar. Bu yöntem sayesinde modelin genişliği, derinliği ve giriş çözünürlüğü koordineli biçimde artırılarak daha yüksek doğruluk elde edilirken, hesaplama karmaşıklığı da kontrol altında tutulur.
Compound Scaling
Geleneksel CNN'ler yalnızca derinliği veya genişliği artırarak performans artırmaya çalışır. EfficientNet ise aşağıdaki eşitlik ile parametreleri dengeli şekilde ölçeklendirir:
Bu eşitlikte, ölçekleme katsayısıdır ve sabit katsayılardır. Böylece model gereksinimlerine göre kontrollü biçimde büyütülebilir. Derinlik daha fazla katman, genişlik her katmandaki filtre sayısı ve çözünürlük ise giriş görüntüsünün boyutunun artırılması anlamına gelir.
Model Ölçekleme. (a) bir temel ağ örneğidir; (b)-(d) yalnızca ağın bir boyutunu (genişlik, derinlik veya çözünürlük) artıran geleneksel ölçekleme yöntemleridir. (e) ise üç boyutun tamamını sabit bir oranla eşit şekilde ölçeklendiren bileşik ölçekleme yöntemidir. (Akademik Yayın)
EfficientNet mimarisinde tekil boyut artırımı yerine çok boyutlu ve dengeli bir ölçekleme stratejisi uygulanır.
EfficientNet Mimari Yapısı
EfficientNet, temel olarak Mobile Inverted Bottleneck Convolution (MBConv) bloklarına dayanır ve bu yapı selektif bilgi akışını ve verimli parametre kullanımını mümkün kılar.
MBConv Blokları
MBConv, giriş ve çıkış arasında dar ve geniş özellik haritaları arasında geçiş yaparak bilgi yoğunluğunu korur. Bu bloklar, verimliliği artırırken aynı zamanda parametre sayısını azaltır.
Squeeze-and-Excitation (SE) Modülü
SE bloğu, her kanala ait önemi öğrenerek özellikleri yeniden ölçekler. Bu da modelin önemli öznitelikleri vurgulamasını sağlar.
EfficientNet Model Ailesi
EfficientNet, B0’dan B7’ye kadar uzanan 8 farklı modelden oluşur. Her model, bir öncekine kıyasla daha fazla parametre içerir ve daha yüksek doğruluk sunar.
Model Boyutu vs Imagenet En iyi 1 Doğruluğu (Akademik Yayın)
Avantajları
- Yüksek doğruluk ve düşük parametre maliyeti
- Mobil ve gömülü cihazlar için uygunluk
- Transfer öğrenme için başarılı performans
- Az veri ile etkili öğrenme
Kullanım Alanları
- Görüntü sınıflandırma
- Nesne tespiti
- Görüntü segmentasyonu
- Medikal görüntü analizi
- Mobil yapay zeka uygulamaları


