FTRL (Follow The Regularized Leader)

Bilişim Ve İletişim Teknolojileri

+1 Daha

Kaydet

Paylaş

Alıntıla

Yıl

2011

Avantajları

Çevrim içi öğrenmeye uygunGerçek zamanlı uygulamalar için idealGenelleme kabiliyeti yüksek

FTRL, “Follow-The-Regularized-Leader” ifadesinin kısaltmasıdır ve özellikle çevrim içi öğrenme (online learning) senaryoları için tasarlanmış bir optimizasyon algoritmasıdır. Büyük ölçekte ve seyrek (sparse) özelliklere sahip verilerle çalışmak üzere geliştirilmiştir. Google tarafından önerilen bu algoritma, özellikle reklam tahmini, öneri sistemleri ve gerçek zamanlı öğrenme sistemlerinde yaygın şekilde kullanılır.

FTRL Optimizasyon Algoritması

Temel Yaklaşım

FTRL, klasik gradyan inişi yöntemlerinden farklı olarak önceki adımlarda biriken gradyanların ve düzenlileştirme terimlerinin bir kombinasyonu üzerinden güncelleme yapar. Özellikle L1 ve L2 düzenlileştirme terimlerini doğrudan güncelleme fonksiyonunun bir parçası hâline getirerek, parametrelerin seyrekliğini teşvik eder. Bu özelliğiyle Lasso (L1) gibi etkili özellik seçim mekanizmalarıyla benzer davranışlar sergiler.

Matematiksel Tanım

FTRL güncellemesi şu şekilde ifade edilir:

θt+1=argminθ(∑s=1tgsTθ+21∑s=1tσs∥θ∥22+λ1∥θ∥1)

Burada:

gs: s adımındaki gradyan
σs: adım başına artan ağırlıklandırma katsayısı
λ1: L1 düzenlileştirme katsayısı
θ: öğrenilen parametreler

Bu formül, önceki tüm gradyanları ve düzenlileştirme cezalarını göz önünde bulundurarak parametreleri günceller.

Özellikleri

Avantajları

Seyrek veri ile uyumlu: L1 düzenlileştirme ile çok sayıda gereksiz özelliği sıfırlayabilir.
Çevrim içi güncellemeye uygun: Büyük veri akışları ile çalışmak için uygundur.
Gerçek zamanlı öğrenme: Özellikle internet reklamcılığı ve öneri motorlarında yaygındır.
Dengeli genelleme: L1 ve L2’nin birlikte kullanımı aşırı uyum riskini azaltır.

Dezavantajları

Parametre ayarlaması hassastır: L1 ve L2 katsayıları dikkatle belirlenmelidir.
GPU/derin öğrenme için optimize edilmemiştir: Daha çok CPU tabanlı modellerde kullanılır.
Yoğun veri için uygun değildir: Seyrek olmayan (dense) verilerde performansı sınırlıdır.