MobileNet, Google tarafından geliştirilen ve özellikle mobil ve gömülü cihazlarda çalışmak üzere optimize edilmiş bir derin öğrenme mimarisidir. Bu mimari, geleneksel konvolüsyonel sinir ağlarının (CNN) performansını korurken, işlem maliyeti ve model boyutunu ciddi şekilde azaltmayı hedefler. MobileNet modelleri, düşük gecikme süresi ve düşük güç tüketimi gerektiren uygulamalarda yaygın olarak kullanılmaktadır.
Derinlik Ayrık Konvolüsyon (Depthwise Separable Convolution)
MobileNet mimarisinin temel yapı taşı, standart konvolüsyon işlemini daha verimli hale getiren derinlik ayrık konvolüsyon tekniğidir.
Standart Konvolüsyonun Yükü
Klasik konvolüsyon katmanlarında her filtre, girişin tüm derinliği boyunca uygulanır. Bu da çok sayıda çarpma-toplama işlemi gerektirir ve hesaplama maliyetini artırır.
Derinlik Ayrık Konvolüsyon Yapısı
Derinlik ayrık konvolüsyon iki adımdan oluşur:
- Derinlik Konvolüsyon: Her kanal için ayrı ayrı konvolüsyon uygulanır. Bu işlem giriş boyutunu korurken kanal sayısını değiştirmez.
- Noktasal Konvolüsyon (1×1): Kanal boyutunu dönüştürmek için 1×1 evrişim uygulanır. Bu adım, özellik haritalarını yeniden birleştirir.
Bu yapı sayesinde hesaplama yükü yaklaşık olarak 8-9 kat azaltılabilir. Aşağıdaki görsel, derinlik ayrık konvolüsyonun işleyişini özetlemektedir.
Derinlik ve Nokta Konvolüsyon (Kaynak = Akademik Yayın)
Derinlik ayrık konvolüsyon, standart konvolüsyona kıyasla çok daha az parametre ve hesaplama gerektirir.
MobileNet Varyantları
MobileNet mimarisi, zamanla farklı sürümlerle geliştirilmiştir. Her sürüm, hız-performans dengesine yeni katkılar sağlar.
MobileNetV1
- Derinlik ayrık konvolüsyon mimarisini temel alır.
- Genişlik (width multiplier, α) ve çözünürlük (resolution multiplier, ρ) hiperparametreleri ile ölçeklenebilir yapı sunar.
- Küçük modellerde bile yüksek doğruluk sağlar.
MobileNetV2
- Inverted Residual Blocks adı verilen yapı ile bilgi kaybı azaltılır.
- Kapsayıcı bağlantılar (skip connections) ile gradyan akışı artırılır.
- ReLU6 aktivasyon fonksiyonu kullanılır.
MobileNetV3
- Ağ mimarisi, Neural Architecture Search (NAS) yöntemiyle otomatik olarak optimize edilmiştir.
- Small ve Large olarak 2 varyantı vardır.
- SE (Squeeze-and-Excitation) blokları içerir.
- Hız, doğruluk ve verimlilik açısından en gelişmiş MobileNet sürümüdür.
Uygulama Alanları
MobileNet, özellikle kaynak kısıtlı ortamlarda tercih edilen bir mimaridir. Uygulama alanlarından bazıları şunlardır:
- Gerçek zamanlı görüntü sınıflandırma (mobil uygulamalar)
- Nesne tespiti ve segmentasyonu
- Yüz tanıma sistemleri
- Artırılmış gerçeklik (AR) uygulamaları
- IoT cihazlarında yapay zeka


