
EfficientNet, görüntü sınıflandırma görevlerinde yüksek doğruluk sağlamakla birlikte hesaplama maliyetini minimumda tutmayı amaçlayan bir derin öğrenme mimarisidir. İlk olarak 2019 yılında Google AI tarafından tanıtılan EfficientNet ailesi, hem doğruluk hem de verimlilik açısından önceki konvolüsyonel sinir ağı (CNN) mimarilerine göre önemli gelişmeler sunmuştur. Modelin temelinde, derinlik (depth), genişlik (width) ve çözünürlük (resolution) olmak üzere üç temel ölçütün dengeli biçimde ölçeklenmesi yatmaktadır.
EfficientNet, CNN mimarilerinde yaygın olan tek boyutlu ölçekleme stratejilerinin aksine, eşzamanlı çok boyutlu ölçekleme (compound scaling) yöntemi sunar. Bu yöntem sayesinde modelin genişliği, derinliği ve giriş çözünürlüğü koordineli biçimde artırılarak daha yüksek doğruluk elde edilirken, hesaplama karmaşıklığı da kontrol altında tutulur.
Geleneksel CNN'ler yalnızca derinliği veya genişliği artırarak performans artırmaya çalışır. EfficientNet ise aşağıdaki eşitlik ile parametreleri dengeli şekilde ölçeklendirir:
<span class="katex"><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord text"><span class="mord">Derinlik (Depth)</span></span><span class="mspace" style="margin-right:0.2778em;"></span><span class="mrel">=</span><span class="mspace" style="margin-right:0.2778em;"></span></span><span class="base"><span class="strut" style="height:0.8491em;"></span><span class="mord"><span class="mord mathnormal" style="margin-right:0.0037em;">α</span><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.8491em;"><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathnormal mtight">ϕ</span></span></span></span></span></span></span></span><span class="mspace" style="margin-right:1em;"></span></span><span class="mspace newline"></span><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord text"><span class="mord">Geni</span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.4306em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord">s</span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2222em;"><span class="mord">¸</span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.1701em;"><span></span></span></span></span></span><span class="mord">lik (width)</span></span><span class="mspace" style="margin-right:0.2778em;"></span><span class="mrel">=</span><span class="mspace" style="margin-right:0.2778em;"></span></span><span class="base"><span class="strut" style="height:1.0435em;vertical-align:-0.1944em;"></span><span class="mord"><span class="mord mathnormal" style="margin-right:0.05278em;">β</span><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.8491em;"><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathnormal mtight">ϕ</span></span></span></span></span></span></span></span><span class="mpunct">,</span><span class="mspace" style="margin-right:1em;"></span></span><span class="mspace newline"></span><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord text"><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.6833em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord">C</span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2222em;"><span class="mord">¸</span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.1701em;"><span></span></span></span></span></span><span class="mord accent"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.6679em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord">o</span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.25em;"><span class="mord">¨</span></span></span></span></span></span></span><span class="mord">z</span><span class="mord accent"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.6679em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord">u</span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.25em;"><span class="mord">¨</span></span></span></span></span></span></span><span class="mord">n</span><span class="mord accent"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.6679em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord">u</span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.25em;"><span class="mord">¨</span></span></span></span></span></span></span><span class="mord">rl</span><span class="mord accent"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.6679em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord">u</span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.25em;"><span class="mord">¨</span></span></span></span></span></span></span><span class="mord">k (resolution)</span></span><span class="mspace" style="margin-right:0.2778em;"></span><span class="mrel">=</span><span class="mspace" style="margin-right:0.2778em;"></span></span><span class="base"><span class="strut" style="height:1.0435em;vertical-align:-0.1944em;"></span><span class="mord"><span class="mord mathnormal" style="margin-right:0.05556em;">γ</span><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.8491em;"><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathnormal mtight">ϕ</span></span></span></span></span></span></span></span></span></span></span>
Bu eşitlikte, <span class="katex"><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.8889em;vertical-align:-0.1944em;"></span><span class="mord mathnormal">ϕ</span></span></span></span> ölçekleme katsayısıdır ve <span class="katex"><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.8889em;vertical-align:-0.1944em;"></span><span class="mord mathnormal" style="margin-right:0.0037em;">α</span><span class="mpunct">,</span><span class="mspace" style="margin-right:0.1667em;"></span><span class="mord mathnormal" style="margin-right:0.05278em;">β</span><span class="mpunct">,</span><span class="mspace" style="margin-right:0.1667em;"></span><span class="mord mathnormal" style="margin-right:0.05556em;">γ</span></span></span></span> sabit katsayılardır. Böylece model gereksinimlerine göre kontrollü biçimde büyütülebilir. Derinlik daha fazla katman, genişlik her katmandaki filtre sayısı ve çözünürlük ise giriş görüntüsünün boyutunun artırılması anlamına gelir.
EfficientNet mimarisinde tekil boyut artırımı yerine çok boyutlu ve dengeli bir ölçekleme stratejisi uygulanır.
EfficientNet, temel olarak Mobile Inverted Bottleneck Convolution (MBConv) bloklarına dayanır ve bu yapı selektif bilgi akışını ve verimli parametre kullanımını mümkün kılar.
MBConv, giriş ve çıkış arasında dar ve geniş özellik haritaları arasında geçiş yaparak bilgi yoğunluğunu korur. Bu bloklar, verimliliği artırırken aynı zamanda parametre sayısını azaltır.
SE bloğu, her kanala ait önemi öğrenerek özellikleri yeniden ölçekler. Bu da modelin önemli öznitelikleri vurgulamasını sağlar.
EfficientNet, B0’dan B7’ye kadar uzanan 8 farklı modelden oluşur. Her model, bir öncekine kıyasla daha fazla parametre içerir ve daha yüksek doğruluk sunar.

Henüz Tartışma Girilmemiştir
"EfficientNet" maddesi için tartışma başlatın
Verimli Ölçekleme Stratejisi
Compound Scaling
EfficientNet Mimari Yapısı
MBConv Blokları
Squeeze-and-Excitation (SE) Modülü
EfficientNet Model Ailesi
Avantajları
Kullanım Alanları
Bu madde yapay zeka desteği ile üretilmiştir.