ResNeXt, derin konvolüsyonel sinir ağlarında doğruluğu artırırken parametre verimliliğini korumayı hedefleyen bir CNN mimarisidir. Facebook AI Research (FAIR) tarafından 2017 yılında önerilen bu yapı, ResNet mimarisindeki artık (residual) bağlantı ilkesini Inception mimarisindeki grup temelli ayrık dönüşüm fikriyle birleştirerek geliştirir. ResNeXt’in temel yeniliği, aynı yapıdaki dönüşümlerin paralel dallar (cardinality) üzerinden bir araya getirilmesidir.
ResNeXt Mimarisinin Temelleri
ResNeXt, ResNet'teki artık öğrenme bloklarını temel alırken, her bloğun içinde birden çok paralel dönüşüm yolunu barındırır. Bu paralel yollar daha sonra birleştirilerek çıktı elde edilir. Böylece model, parametre sayısını artırmadan daha yüksek model kapasitesi sağlar.
Cardinality (Kardinalite)
ResNeXt mimarisinde en önemli kavramlardan biri cardinality yani paralel dönüşüm sayısıdır. Bu, her bloğun kaç ayrı yol içerdiğini ifade eder ve modelin kapasitesini artırmada en etkili parametrelerden biridir.
Burada , her biri aynı yapıya sahip olan dönüşüm fonksiyonlarını ve cardinality değerini ifade eder.
Soldaki ResNet' e ait blok yapısı, Sağdaki ResNeXt'e ait C = 32 olan blok yapısı (Akademik Yayın)
ResNeXt blokları, aynı yapıdaki birden çok dönüşüm yolunu paralel olarak işler ve bu yolların çıktıları birleştirilerek nihai çıktı elde edilir.
Yapısal Özellikler
Grup Konvolüsyonları
ResNeXt mimarisinde, her dönüşüm yolu grup konvolüsyonları kullanılarak uygulanır. Bu yöntem, parametre verimliliğini artırır ve her grubun farklı özellikler öğrenmesini sağlar. Bu, modelin daha verimli hale gelmesini sağlar.
Modüler Tasarım
ResNeXt blokları, belirli bir yapı standardına sahiptir. Bu da ölçeklenebilirlik ve farklı veri kümeleri üzerinde transfer öğrenme açısından avantaj sağlar.
Parametre Verimliliği
Aynı FLOP (Floating Point Operation) ve parametre sayısı ile daha yüksek doğruluk sağlamak mümkündür. Bu yönüyle ResNeXt, VGG ve ResNet gibi modellerle kıyaslandığında daha etkili sonuçlar verir.
Kullanım Alanları
- Görüntü sınıflandırma
- Nesne tespiti
- Video sınıflandırma (ResNeXt-3D türevleri)
- Medikal görüntü işleme
- Büyük ölçekli görsel arama sistemleri


