logologo
Ai badge logo

Bu madde yapay zeka desteği ile üretilmiştir.

Lion

Bilişim Ve İletişim Teknolojileri+1 Daha
fav gif
Kaydet
viki star outline
Lion.png
Yıl
2023
Avantajları
Düşük Bellekİşaret Bazlı Momentum

Lion (Evolved Sign Momentum Optimizer), 2023 yılında Google DeepMind araştırmacıları tarafından tanıtılan yeni nesil bir optimizasyon algoritmasıdır. Adı “Evolved Sign Momentum” kavramına dayanan Lion (Layer-wise Optimizer), özellikle büyük ölçekli modellerde verimli, doğru ve düşük kaynak tüketimli optimizasyon sağlamayı hedefler. Özellikle transformer tabanlı büyük dil modelleri gibi yoğun hesaplama gerektiren ağlarda dikkat çekici başarılar elde etmiştir.

Lion Optimizasyon Algoritması

Temel Yaklaşım

Lion, klasik optimizasyon yöntemlerinin (örneğin Adam, SGD) aksine, ağırlıkların güncellenmesinde yalnızca gradyanların işaretini kullanır. Bu yaklaşım, hem hafıza verimliliğini artırır hem de kararsızlıkları (oscillation) azaltır.

Formül düzeyinde Lion algoritması şu şekilde ifade edilir:


mt+1=β1mt+(1β1)L(θt)m_{t+1} = \beta_1 \cdot m_t + (1 - \beta_1) \cdot \nabla L(\theta_t)

θt+1=θtηsign(mt+1)\theta_{t+1} = \theta_t - \eta \cdot \text{sign}(m_{t+1}) 


Burada:

  • mtm_t: momentum vektörü
  • β1\beta_1: momentum katsayısı
  • η\eta: öğrenme oranı
  • L(θt)\nabla L(\theta_t): parametrelerin mevcut gradyanı


Özellikle dikkat edilmesi gereken nokta, parametre güncellemesinin gradyan büyüklüğüne değil sadece yönüne (işaretine) bağlı olmasıdır.

Özellikleri

Avantajları

  • Hafıza dostu: Adam gibi kare gradyanlar tutmak yerine sadece momentum izlediği için bellek tasarrufu sağlar.
  • Yüksek doğruluk: Özellikle Vision Transformer (ViT) ve LLM gibi modellerde güçlü sonuçlar vermektedir.
  • Basit ve etkili: Sign kullanımı ile parametre güncellemeleri sadeleşir.
  • Hızlı yakınsama: Daha düşük adım sayısıyla yüksek doğruluk elde edilebilir.

Dezavantajları

  • Yaygın kullanımda yeni: Diğer optimizasyon yöntemlerine göre daha az test edilmiştir.
  • Gradyan büyüklüğü kaybı: Yönsel güncelleme, bazı durumlarda öğrenmeyi yavaşlatabilir.

Uygulama Alanları

  • Büyük dil modelleri (LLM)
  • Görsel transformer mimarileri (ViT)
  • Görüntü sınıflandırma, segmentasyon
  • Büyük ölçekli eğitim senaryoları

Lion Optimizasyon Yöntemiyle Parametrelerin Güncellenmesi (Kaan Gümele)


Lion, momentum vektörünün yönünü baz alarak yapılan sadeleştirilmiş parametre güncellemesi sayesinde verimli optimizasyon sağlar.

Kaynakça

Chen, Xiangning, Chen Liang, Da Huang, Esteban Real, Kaiyuan Wang, Yao Liu, Hieu Pham, et al. 2023. “Symbolic Discovery of Optimization Algorithms,” February. https://doi.org/10.48550/arxiv.2302.06675.

Sen de Değerlendir!

0 Değerlendirme

Yazar Bilgileri

Avatar
Ana YazarKaan Gümele27 Nisan 2025 23:47
KÜRE'ye Sor