KÜRE LogoKÜRE Logo
Ai badge logo

Bu madde yapay zeka desteği ile üretilmiştir.

Derin Öğrenme ile Görüntü İşleme

Havacılık Ve Uzay+2 Daha
fav gif
Kaydet
kure star outline

Derin öğrenme (Deep Learning), yapay zekânın alt alanlarından biri olan makine öğrenmesinin içinde yer almaktadır. Genel olarak yapay zekâ, insan benzeri yetenekleri taklit eden sistemleri ifade ederken; makine öğrenmesi, verilerden öğrenen ve zamanla kendini geliştiren algoritmalar bütünüdür. Derin öğrenme terimi, aslında Yapay Sinir Ağlarını (Artificial Neural Networks - ANN) kullanan yöntemleri tanımlanmaktadır. İnsan beynindeki nöronlara benzer şekilde, yapay sinir ağları da düğümler (nöronlar) ve bu düğümleri birbirine bağlayan bağlantılardan (sinapslar) oluşmaktadır. Görüntü işleme ise dijital görüntüler üzerinde yapılan analiz, düzenleme ve dönüştürme gibi çalışmaları kapsamaktadır. Derin öğrenme ve görüntü işleme, özellikle son yıllarda birbirini tamamlayan teknolojiler olarak büyük bir etki etmektedir. Derin öğrenme, görüntüler üzerinde daha doğru sınıflandırmalar yapabilme, nesneleri tespit etme, segmentasyon, risk ve veri analizi gibi pek çok işlemde önemli başarı sağlamaktadır. Gelişimiyle birlikte daha çok kolaylık sağlaması beklenmektedir.


Derin Öğrenme

Deep Learning (Derin Öğrenme) temelde veriyi işlemek için farklı algoritmaların katmanlar halinde sıralanması ve verinin her bir katmandan tek tek geçerek istenen sonucu vermesini sağlayan bir sistemdir. Ayrıca Derin Öğrenme günümüzde üzerine en çok araştırma ve çalışma yapılan sistemlerden biri olmaktadır. Verileri ne kadar çok özellikler ile sınıflandırabilirsek doğru sonuca ulaşılması da o kadar kolaylaşmaktadır.


Örneğin; Bir telefon almak istediğinizde karar vermeden önce kafanızda birçok kriter bir anda işlemeye başlar: ekran boyutu, kamera kalitesi, pil ömrü, işlemci gücü, fiyat, marka güvenilirliği, depolama kapasitesi, rengi ve cihazın tasarımı gibi verileri karşılaştırıp değerlendirip en sonunda "bu telefon bana uygun" ya da "bu fiyata değmez" gibi bir sonuca ulaşılmaktadır. Derin öğrenme de benzer şekilde çalışır. Tek bir karara varmak için onlarca, hatta yüzlerce parametreyi değerlendirir. Her bir özellik veriye anlam katarak modelin doğru karara ulaşma ihtimalini arttırmaktadır. Bu işlemler modelin içindeki katmanlarda gerçekleşir ve her katman kendi içinde farklı algoritmalarla çalışmaktadır. Yani aslında her katman, veriye yeni bir bakış açısı katmaktadır. ''Ne kadar çok katman o kadar iyi sonuç" demek de doğru değildir. Çünkü sistem karmaşıklaştıkça işlem süresi artmaktadır. Gerçek zamanlı çalışan sistemler için bu, ciddi bir problem oluşturmaktadır.


Çok Katmanlı Sinir Ağları (Kaynak: Görsel yapay zeka ile oluşturulmuştur.)

Görüntü İşlemede Derin Öğrenme

Derin öğrenme, bilgisayarlara görsel verileri insanlar gibi algılama, yorumlama ve sınıflandırma yeteneği kazandırmaktadır. Özellikle büyük miktarda görsel verinin analiz edilmesi gereken alanlarda, klasik algoritmalardan çok daha başarılı sonuçlar elde etmektedir. Geleneksel görüntü işleme yöntemlerinde, belirli kurallara dayalı algoritmalarla işlem yapılırken, derin öğrenme sayesinde sistemler veriden öğrenerek kendi kurallarını oluşturabilmektedir. Bu da karmaşık görüntülerdeki desenleri, nesneleri ve ilişkileri çok daha iyi anlamalarını sağlamaktadır.

CNN – Convolutional Neural Networks (Evrişimli Sinir Ağları)

Evrişimli Sinir Ağları (CNN), görüntü işleme alanında derin öğrenmenin en güçlü yöntemlerinden biridir. Bu ağlar; kenar tespiti, şekil analizi, renk örüntüleri gibi temel özellikleri katmanlar aracılığıyla adım adım öğrenerek görüntüyü yorumlamaktadır. Görüntünün küçük parçalarını tarayarak (filtreleme gibi), hangi özniteliklerin önemli olduğunu öğrenerek ve bunları sınıflandırmaktadır. İlk katmanlar genellikle basit kenarları ve dokuları algılarken, derin katmanlar daha soyut ve karmaşık yapıları fark edebilmektedir. Örneğin; ilk katman bir daire algılarken, daha derindeki katmanlar bir insan yüzünü ya da bir arabanın siluetini tanıyabilmektedir. Bu sistemler, özellikle nesne tanıma, yüz tanıma ve sınıflandırma gibi görevlerde çok kullanılmaktadır. Geleneksel yapay sinir ağları veriyi düzleştirerek işlerken, CNN’ler görüntünün iki boyutlu yapısını koruyarak mekânsal ilişkileri öğrenmektedir. Bu özellik, görüntüdeki desenlerin, kenarların, dokuların ve diğer yapısal bilgilerin kaybolmadan işlenmesini sağlamaktadır.


Bir CNN genel olarak aşağıdaki katmanlardan oluşmaktadır:

  • Input Layer: Bu katman, giriş görüntüsüne küçük boyutlu filtreler (kernel) uygulamaktadır. Bu filtreler, görüntüdeki belirli özellikleri (örneğin kenar, köşe, doku gibi) tespit etmek için öğrenilmektedir. Filtrenin her bir kaydırması sonucunda oluşan yeni matris, "özellik haritası" (feature map) olarak adlandırılmaktadır.
  • Aktivasyon Fonksiyonu (ReLU): Genellikle ReLU (Rectified Linear Unit) aktivasyon fonksiyonu olarak kullanılmaktadır. Bu katman, doğrusal olmayanlık kazandırarak ağı daha karmaşık desenleri öğrenebilir hâle getirmektedir. Negatif değerleri sıfıra çeker ve sadece pozitif çıktılarla devam edilmektedir. Bu sayede ağın daha karmaşık kararlar verebilmesi sağlanmaktadır.
  • Pooling (Havuzlama) Katmanı: Özellik haritalarının boyutunu küçültmek ve daha soyut temsiller elde etmek için kullanılmaktadır. En yaygın yöntem Max Pooling’dir. Bu sayede hesaplama maliyeti azalır ve ağ, küçük kaymalara karşı daha dayanıklı hale gelmektedir.
  • Fully Connected (Tam Bağlantılı) Katman: Bu katmanlarda tüm nöronlar birbirine bağlanır. Ağın son aşamasıdır ve burada elde edilen yüksek düzey özellikler sınıflandırma için kullanılır.
  • Output Layer (Çıktı Katmanı): Burası modelin karar verdiği yer olmaktadır. Son katmanda Softmax aktivasyon fonksiyonu uygulanmaktadır. Bu fonksiyon, her sınıfa ait olasılığı hesaplar ve toplamı 1 olan bir dağılım üretmektedir. Yüksek olan değer modelin en olabilme ihtimalini vermektedir.


Convolutional Neural Networks (CNN) (Kaynak: Nafizul Haque)


Yukardaki resimde Input katmanında olarak bir zebra görseli verilerek ve model bu görsel üzerinde çeşitli işlemler yaparak adım adım önemli özellikleri çıkarmaktadır. En sonunda ise Output katmanında model her bir sınıfa ait at, zebra, köpek ait olasılıkları vermektedir. Bu örnekte, görselin "zebra" olma olasılığı %70 olarak tahmin etmektedir. Bu da demek oluyor ki model, bu görseldeki hayvanın büyük ihtimalle bir zebra olduğunu düşünmektedir. Yani sistem, eğitildiği verilerle öğrendiği bilgileri kullanarak görüntüyü başarıyla sınıflandırmış olmaktadır.

Derin Öğrenme ile Görüntü İşleme Uygulama Alanları

Derin öğrenme, sadece bir görüntüyü sınıflandırmakla için değil aynı zamanda segmentasyon, nesne tespiti, yüz tanıma, görüntüden metin çıkarma (OCR) gibi birçok farklı görevi de yüksek doğrulukla başarabilmektedir. Bu yönüyle, sağlık alanından güvenliğe, tarımdan otonom araçlara kadar pek çok sektörde yer almaktadır.


  • Yüz Tanıma Sistemleri: Telefonlardaki ekran kilidinden havaalanlarındaki güvenlik kontrollerine kadar birçok yerde kullanılmaktadır. Derin öğrenme sayesinde yüzler çok daha hassas bir şekilde tanımlanmaktadır.
  • Nesne Tespiti ve Takibi: Bir görüntüdeki nesneleri (örneğin araba, insan, hayvan vs.) tespit etmek ve onları sahne içinde takip etmek artık oldukça yaygın bir uygulama olmaktadır. Bu, özellikle güvenlik kameralarında ve akıllı şehir uygulamalarında çok işe yaramaktadır.
  • Tıbbi Görüntü Analizi: MR, röntgen gibi görüntülerde tümör ya da anormallik tespiti gibi işlemlerde yapabilmektedir. Derin öğrenme, doktorlara hızlı ve doğru bir ikinci görüş konusunda yardımcı olabilmektedir.
  • Otonom Araçlar: Arabaların çevresini algılayabilmesi, trafik işaretlerini, yayaları ve diğer araçları tanıyabilmesi için görüntü işleme önemli yer almaktadır. Bu sistemlerin temelinde de yine derin öğrenme kullanılmaktadır.
  • Tarımda Görüntü İşleme: Dronlarla tarladan çekilen görüntüler, bitkilerin sağlığı ya da zararlı varlığı gibi durumları analiz etmek için kullanılmaktadır. Ürün kalitesini artırmak için büyük kolaylık sağlayıp üretime fayda sağlamaktadır.
  • Sanayi ve Üretim: Üretim hatlarında kalite kontrolü sağlamak için ürünlerin görüntüleri işlenerek hatalı olanlar anında ayırt edebilmektedir.


Kaynakça

API4AI. "Mastering Deep Learning: Key Concepts and Its Impact on Image Processing." Medium. 2023. Erişim Adresi

Goodfellow, Ian, Yoshua Bengio, and Aaron Courville. Deep Learning. Cambridge: MIT Press, 2016.

Gupta, Ananya, and Rahul Verma. "The Use of Deep Learning and Image Processing in Smart Agriculture Technologies." Agricultural Technology Review, vol. 12, no. 4, 2022, pp. 89-95.

LeCun, Yann, Yoshua Bengio, and Geoffrey Hinton. "Deep Learning." Nature 521, no. 7553 (2015): 436-44.

Smith, John, and Emily Brown. "Deep Learning and Image Processing: Applications in Medical Imaging." Journal of Health Technology, vol. 15, no. 3, 2023, pp. 67-78.

Startup Vadisi. "Bir Görüntü İşleme Projesi Geliştirelim." 2020. Erişim Adresi.

Zhang, Qi, Lakhmi C. Jain, and Zhiwei Luo. "A Survey on Deep Learning for Big Data." Information Fusion 42, 2018, pp. 146-57.

Miller, David, and Jessica White. "The Impact of Deep Learning and Image Processing on Industrial Automation." Industrial Automation Journal, vol. 10, no. 3, 2023, pp. 45-58.

Sen de Değerlendir!

0 Değerlendirme

Yazar Bilgileri

Avatar
Ana YazarBetül Kırımlıoğlu10 Nisan 2025 16:30
KÜRE'ye Sor