logologo
Ai badge logo

Bu madde yapay zeka desteği ile üretilmiştir.

FTRL (Follow The Regularized Leader)

Bilişim Ve İletişim Teknolojileri+1 Daha
fav gif
Kaydet
viki star outline
ftrl.png
Yıl
2011
Avantajları
Çevrim içi öğrenmeye uygunGerçek zamanlı uygulamalar için idealGenelleme kabiliyeti yüksek

FTRL, “Follow-The-Regularized-Leader” ifadesinin kısaltmasıdır ve özellikle çevrim içi öğrenme (online learning) senaryoları için tasarlanmış bir optimizasyon algoritmasıdır. Büyük ölçekte ve seyrek (sparse) özelliklere sahip verilerle çalışmak üzere geliştirilmiştir. Google tarafından önerilen bu algoritma, özellikle reklam tahmini, öneri sistemleri ve gerçek zamanlı öğrenme sistemlerinde yaygın şekilde kullanılır.

FTRL Optimizasyon Algoritması

Temel Yaklaşım

FTRL, klasik gradyan inişi yöntemlerinden farklı olarak önceki adımlarda biriken gradyanların ve düzenlileştirme terimlerinin bir kombinasyonu üzerinden güncelleme yapar. Özellikle L1L_1 ve L2L_2 düzenlileştirme terimlerini doğrudan güncelleme fonksiyonunun bir parçası hâline getirerek, parametrelerin seyrekliğini teşvik eder. Bu özelliğiyle Lasso (L1L_1) gibi etkili özellik seçim mekanizmalarıyla benzer davranışlar sergiler.

Matematiksel Tanım

FTRL güncellemesi şu şekilde ifade edilir:

θt+1=argminθ(s=1tgsTθ+12s=1tσsθ22+λ1θ1)\theta_{t+1} = \arg\min_{\theta} \left( \sum_{s=1}^{t} g_s^T \theta + \frac{1}{2} \sum_{s=1}^{t} \sigma_s \|\theta\|_2^2 + \lambda_1 \|\theta\|_1 \right) 

Burada:

  • gsg_s: s adımındaki gradyan
  • σs\sigma_s: adım başına artan ağırlıklandırma katsayısı
  • λ1\lambda_1: L1 düzenlileştirme katsayısı
  • θ\theta: öğrenilen parametreler


Bu formül, önceki tüm gradyanları ve düzenlileştirme cezalarını göz önünde bulundurarak parametreleri günceller.

Özellikleri

Avantajları

  • Seyrek veri ile uyumlu: L1 düzenlileştirme ile çok sayıda gereksiz özelliği sıfırlayabilir.
  • Çevrim içi güncellemeye uygun: Büyük veri akışları ile çalışmak için uygundur.
  • Gerçek zamanlı öğrenme: Özellikle internet reklamcılığı ve öneri motorlarında yaygındır.
  • Dengeli genelleme: L1 ve L2’nin birlikte kullanımı aşırı uyum riskini azaltır.

Dezavantajları

  • Parametre ayarlaması hassastır: L1 ve L2 katsayıları dikkatle belirlenmelidir.
  • GPU/derin öğrenme için optimize edilmemiştir: Daha çok CPU tabanlı modellerde kullanılır.
  • Yoğun veri için uygun değildir: Seyrek olmayan (dense) verilerde performansı sınırlıdır.

Uygulama Alanları

  • Tıklama tahmini (CTR) sistemleri
  • Reklam açık artırmaları (RTB)
  • Öneri sistemleri
  • Gerçek zamanlı kullanıcı davranışı modelleme
  • Büyük ölçekli metin sınıflandırma

FTRL'nin adım adım düzenlileştirilmiş optimizasyon süreci görselleştirildi. (Github)


FTRL, geçmiş gradyanlar ve düzenlileştirme terimlerini hesaba katarak çevrim içi ve seyrek öğrenmeyi mümkün kılar.

Kaynakça

McMahan, H. Brendan, Daniel Golovin, Sharat Chikkerur, Dan Liu, Martin Wattenberg, Arnar Mar Hrafnkelsson, Tom Boulos, et al. 2013. “Ad Click Prediction.” Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining - KDD ’13. https://doi.org/10.1145/2487575.2488200.


Bottou, Léon. 2012. “Stochastic Gradient Descent Tricks.” Lecture Notes in Computer Science, 421–36. https://doi.org/10.1007/978-3-642-35289-8_25.

Sen de Değerlendir!

0 Değerlendirme

Yazar Bilgileri

Avatar
Ana YazarKaan Gümele27 Nisan 2025 23:04
KÜRE'ye Sor