YOLO, tek bir yapay sinir ağı geçişiyle bir görüntüdeki tüm nesnelerin konumunu ve sınıfını aynı anda tahmin eden bir nesne tespiti algoritmasıdır. Yapay zekâ ve derin öğrenme alanında önemli bir yer edinen YOLO, gerçek zamanlı analiz kapasitesi sayesinde özellikle video işleme ve otonom sistemlerde tercih edilmektedir. YOLO'nun en belirgin özelliği, nesneleri tek adımda algılayarak hem hız hem de doğruluk açısından etkili sonuçlar sunmasıdır.
YOLO11 Tarafından Desteklenen Bilgisayarla Görme Görevleri.(Ultralytics/Şekil 3)
Gelişim Süreci
YOLO algoritması, ilk kez 2016 yılında Joseph Redmon ve Ali Farhadi tarafından geliştirildi. Bu algoritma, geleneksel bölgesel yaklaşımın aksine tüm görüntüyü tek bir CNN (Convolutional Neural Network) ile işleyerek nesneleri belirlemeyi amaçlamaktadır.
Zamanla geliştirilen yeni sürümlerle algoritmanın doğruluk oranı ve hız dengesi artırılmıştır:
- YOLOv1: İlk versiyon, temel çalışma prensibini ortaya koymuştur.
- YOLOv2 (YOLO9000): Daha fazla sınıf desteği ve iyileştirilmiş konum tahmini.
- YOLOv3: Çok ölçekli tahmin özelliğiyle küçük nesnelerde daha iyi başarı.
- YOLOv4: Topluluk katkısıyla geliştirilen, hız ve doğruluk açısından dengeli bir yapı.
- YOLOv5–v8: PyTorch tabanlı, modüler ve mobil uyumlu modern sürümler.
Çalışma Prensibi
YOLO, giriş görüntüsünü S×S boyutlu bir ızgaraya ayırır. Her hücre, içerdiği nesne olup olmadığını belirler ve varsa nesnenin sınıfı ile konum bilgilerini tahmin eder. Her tahmin, sınıf olasılığı, sınıra ait x ve y koordinatları, genişlik ve yükseklik değerleri ile birlikte gelir. Sonuçlar, IoU (Intersection over Union) metriğiyle değerlendirilerek doğru kutular belirlenir.
Bu yapı sayesinde YOLO, geleneksel yöntemlere kıyasla çok daha az işlemle yüksek doğrulukta sonuç üretir. Bu özellik, özellikle video akışlarında gerçek zamanlı performans gerektiren uygulamalar için uygundur.
YOLO algoritması görüntüyü grid hücrelerine bölerek her hücrede nesne olup olmadığını tahmin eder. (Redmon vd. 2016)
Uygulama Alanları
YOLO algoritması, çok çeşitli sektörlerde etkili bir şekilde kullanılmaktadır:
Otonom Araçlar
Araç üzerindeki kameralar ile çevredeki trafik levhaları, yayalar ve araçlar anlık olarak tespit edilerek sürüş güvenliği sağlanır.
Güvenlik Sistemleri
Kapalı devre kamera sistemlerinde canlı izleme sırasında insan tespiti, davranış analizi ve tehdit algılama işlemleri yapılır.
Endüstriyel Otomasyon
Üretim hattında kalite kontrol, ürün sınıflandırma ve ayrıştırma sistemlerinde kullanılır.
Sağlık Teknolojileri
Görüntüleme sistemlerinde, örneğin akciğer grafiklerinde anormal bölge tespiti gibi medikal uygulamalarda kullanılabilir.
Akademik Uygulama Örneği
Kaya ve Akgül tarafından gerçekleştirilen çalışmada, YOLOv2, YOLOv3 ve YOLOv4 algoritmaları bir trafik işareti veri seti üzerinde karşılaştırmalı olarak test edilmiştir. Aşağıdaki tablo, bu algoritmaların başarım oranlarını özetlemektedir:
Algoritma | mAP@0.50 | Doğruluk (%) |
YOLOv2 | %39,3 | 53 |
YOLOv3 | %94,3 | 91 |
YOLOv4 | %83,9 | 75 |