KÜRE LogoKÜRE Logo
Ai badge logo

Bu madde yapay zeka desteği ile üretilmiştir.

MobileNet

Bilişim Ve İletişim Teknolojileri+1 Daha
fav gif
Kaydet
kure star outline
mobileNet_name.png
Model
MobileNet
Yıl
2017 (V1)2018 (V2)2019 (V3)
Geliştirici
Google
Temel Bileşen
(V1) Derin Ayrık Konvolüsyon(V2) Tersine Artık Blok(V3) Sinirsel Mimari Arama
Varyantlar
MobileNet V1MobileNet V2MobileNet V3

MobileNet, Google tarafından geliştirilen ve özellikle mobil ve gömülü cihazlarda çalışmak üzere optimize edilmiş bir derin öğrenme mimarisidir. Bu mimari, geleneksel konvolüsyonel sinir ağlarının (CNN) performansını korurken, işlem maliyeti ve model boyutunu ciddi şekilde azaltmayı hedefler. MobileNet modelleri, düşük gecikme süresi ve düşük güç tüketimi gerektiren uygulamalarda yaygın olarak kullanılmaktadır.

Derinlik Ayrık Konvolüsyon (Depthwise Separable Convolution)

MobileNet mimarisinin temel yapı taşı, standart konvolüsyon işlemini daha verimli hale getiren derinlik ayrık konvolüsyon tekniğidir.

Standart Konvolüsyonun Yükü

Klasik konvolüsyon katmanlarında her filtre, girişin tüm derinliği boyunca uygulanır. Bu da çok sayıda çarpma-toplama işlemi gerektirir ve hesaplama maliyetini artırır.

Derinlik Ayrık Konvolüsyon Yapısı

Derinlik ayrık konvolüsyon iki adımdan oluşur:

  1. Derinlik Konvolüsyon: Her kanal için ayrı ayrı konvolüsyon uygulanır. Bu işlem giriş boyutunu korurken kanal sayısını değiştirmez.
  2. Noktasal Konvolüsyon (1×1): Kanal boyutunu dönüştürmek için 1×1 evrişim uygulanır. Bu adım, özellik haritalarını yeniden birleştirir.

Bu yapı sayesinde hesaplama yükü yaklaşık olarak 8-9 kat azaltılabilir. Aşağıdaki görsel, derinlik ayrık konvolüsyonun işleyişini özetlemektedir.

Derinlik ve Nokta Konvolüsyon (Kaynak = Akademik Yayın)


Derinlik ayrık konvolüsyon, standart konvolüsyona kıyasla çok daha az parametre ve hesaplama gerektirir.

MobileNet Varyantları

MobileNet mimarisi, zamanla farklı sürümlerle geliştirilmiştir. Her sürüm, hız-performans dengesine yeni katkılar sağlar.

MobileNetV1

  • Derinlik ayrık konvolüsyon mimarisini temel alır.
  • Genişlik (width multiplier, α) ve çözünürlük (resolution multiplier, ρ) hiperparametreleri ile ölçeklenebilir yapı sunar.
  • Küçük modellerde bile yüksek doğruluk sağlar.

MobileNetV2

  • Inverted Residual Blocks adı verilen yapı ile bilgi kaybı azaltılır.
  • Kapsayıcı bağlantılar (skip connections) ile gradyan akışı artırılır.
  • ReLU6 aktivasyon fonksiyonu kullanılır.

MobileNetV3

  • Ağ mimarisi, Neural Architecture Search (NAS) yöntemiyle otomatik olarak optimize edilmiştir.
  • Small ve Large olarak 2 varyantı vardır.
  • SE (Squeeze-and-Excitation) blokları içerir.
  • Hız, doğruluk ve verimlilik açısından en gelişmiş MobileNet sürümüdür.

Uygulama Alanları

MobileNet, özellikle kaynak kısıtlı ortamlarda tercih edilen bir mimaridir. Uygulama alanlarından bazıları şunlardır:

  • Gerçek zamanlı görüntü sınıflandırma (mobil uygulamalar)
  • Nesne tespiti ve segmentasyonu
  • Yüz tanıma sistemleri
  • Artırılmış gerçeklik (AR) uygulamaları
  • IoT cihazlarında yapay zeka

Kaynakça

Junejo, Imran, and Naveed Ahmed. “Depthwise Separable Convolutional Neural Networks for Pedestrian Attribute Recognition.” SN Computer Science 2, no. 2 (2021). https://doi.org/10.1007/s42979-021-00493-z

Sandler, Mark, Andrew Howard, Menglong Zhu, Andrey Zhmoginov, and Liang-Chieh Chen. “MobileNetV2: Inverted Residuals and Linear Bottlenecks.” Last modified 2018. https://arxiv.org/abs/1801.04381.

Howard, Andrew G., Menglong Zhu, Bo Chen, Dmitry Kalenichenko, Weijun Wang, Tobias Weyand, Marco Andreetto, and Hartwig Adam. “MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications.” Last modified 2017. https://arxiv.org/abs/1704.04861.

Howard, Andrew, Mark Sandler, Bo Chen, Weijun Wang, Liang-Chieh Chen, Mingxing Tan, Grace Chu, et al. “Searching for MobileNetV3.” Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), October 1, 2019. https://doi.org/10.1109/ICCV.2019.00140.

Ayrıca Bakınız

Yazarın Önerileri

VGG 16

VGG 16

Bilişim Ve İletişim Teknolojileri +1

Sen de Değerlendir!

0 Değerlendirme

Yazar Bilgileri

Avatar
Ana YazarKaan Gümele23 Nisan 2025 23:08
KÜRE'ye Sor