Snorkel AI, kurumsal düzeyde yapay zekâ (YZ) sistemleri için veri geliştirme süreçlerini programatikleştiren bir platform sağlayıcısıdır. Şirket, Stanford Üniversitesi Yapay Zekâ Laboratuvarı’nda 2015 yılında başlatılan Snorkel Research adlı akademik projeye dayanmaktadır. Kurumsal veriyle özelleştirilmiş YZ modelleri geliştirmeye yönelik çözüm sunan Snorkel AI, merkezini Kaliforniya’nın Redwood City şehrinde konumlandırmıştır. Şirketin kurucuları arasında Alex Ratner yer almaktadır.
Kuruluş
Snorkel AI’nin temeli, Stanford Üniversitesi bünyesinde 2015 yılında başlatılan ve zayıf denetimli öğrenme (weak supervision) yöntemlerine odaklanan akademik araştırmalara dayanmaktadır. Bu araştırmalarda Google, Intel ve Amerika Birleşik Devletleri Savunma İleri Araştırma Projeleri Ajansı (DARPA - Defense Advanced Research Projects Agency) gibi kuruluşlarla işbirliği yapılmıştır. Snorkel Research adıyla başlatılan proje, daha sonra ticari bir platforma dönüştürülmüş ve Snorkel AI adı altında faaliyet göstermeye başlamıştır.
Snorkel Flow Platformu
Şirketin temel ürünü olan Snorkel Flow, kurumların sahip olduğu yapılandırılmamış verileri YZ sistemlerinde kullanılabilir hâle getirme amacı taşır. Platform; veri etiketleme, model eğitimi, değerlendirme ve ince ayar süreçlerini merkezi bir yapı üzerinden programatik yöntemlerle yürütmeyi mümkün kılar. Hem kestirimsel makine öğrenimi hem de üretken yapay zekâ sistemleri için kullanılabilir.
Snorkel Flow, veri üzerinde işlem yapmak isteyen uzmanlar ve veri bilimcileri için çeşitli işlevler sunar. Bu işlevler arasında alan odaklı büyük dil modeli (LLM – Large Language Model) değerlendirme araçları, bilgi alma-yardımlı üretim (RAG – Retrieval-Augmented Generation) iş akışları, PDF belgeleri üzerinde adlandırılmış varlık tanıma (NER – Named Entity Recognition), kullanıcı arayüzü iyileştirmeleri ve veri dilimleme gibi analiz yöntemleri yer almaktadır. Platform ayrıca Databricks, Amazon SageMaker, OpenAI ChatGPT, Google Gemini ve Meta Llama gibi teknolojilerle birlikte çalışabilecek şekilde entegre edilebilmektedir.
Veri Merkezli Yapay Zekâ Yaklaşımı
Snorkel AI, model merkezli yaklaşımlardan farklı olarak veri merkezli yapay zekâ yöntemlerini benimser. Bu yaklaşımda odak noktası, modelin mimarisinden ziyade verinin niteliğidir. Platform, alan uzmanlarının bilgilerini yazılı kurallara dönüştürmeye imkân tanıyan programatik etiketleme yöntemleri kullanır. Bu sayede eğitim verilerinin oluşturulması daha sistematik hâle gelir. Veri iş akışları, yazılım geliştirme süreçlerine benzer şekilde sürümlenebilir, düzenlenebilir ve yeniden kullanılabilir biçimde yapılandırılır.
Kullanım Alanları
Snorkel Flow, farklı sektörlerde faaliyet gösteren kurumlar tarafından benimsenmiştir. Bu sektörler arasında bankacılık, sigortacılık, kamu hizmetleri, sağlık ve e-ticaret yer almaktadır. Platform; belge sınıflandırma, müşteri etkileşim analizi, katalog etiketleme, doğal dil işleme (NLP – Natural Language Processing) ve diğer bilgi çıkarımı işlemleri için kullanılabilir. Kullanıcıları arasında BNY Mellon, Wayfair, Chubb ve ABD Hava Kuvvetleri gibi kurumlar bulunmaktadır.
Araştırma Faaliyetleri
Snorkel AI, akademik araştırmalara dayalı bir arka plana sahiptir. Kurucuları ve araştırma ortakları, NeurIPS, ICML ve ICLR gibi bilimsel konferanslarda yayımlanmış 170’in üzerinde hakemli makaleye katkı sunmuştur. Bu yayınlar, zayıf denetim, programatik etiketleme, temel model değerlendirme ve veri dilimleme gibi konulara odaklanmaktadır. Şirket aynı zamanda düzenli olarak SnorkelCon adlı kullanıcı konferansları organize ederek kullanıcı deneyimlerine ve veri merkezli YZ araştırmalarına yer vermektedir.
Snorkel Flow platformuna eklenen güncel özellikler, kurumsal kullanıcıların özel veri üzerinde alan odaklı YZ uygulamaları geliştirme süreçlerini hızlandırmaya yöneliktir. Bu özellikler arasında LLM performansının ayrıntılı analizine olanak tanıyan özelleştirilmiş değerlendirme araçları, belge yapısına dayalı bilgi çıkarımı işlemleri ve uzman geribildirimini daha verimli şekilde toplamak üzere kullanıcı arayüzü yenilikleri bulunmaktadır. Ayrıca sıralı etiketleme süreçlerinde hata modlarının görsel olarak incelenmesini sağlayan analiz araçları geliştirilmiştir.
Gelecek Perspektifi
Snorkel AI, veri hazırlama ve değerlendirme süreçlerinin tekrarlanabilir, izlenebilir ve merkezi bir yapı altında yürütülmesini amaçlayan bir yaklaşım benimsemektedir. Platformun yeni sürümleriyle birlikte alan odaklı YZ sistemlerinin daha kısa sürede geliştirilebilmesine yönelik teknik yetenekler artırılmıştır. Gelecekte, üretken yapay zekâ sistemleri, alan uzmanı geribildirimiyle uyumlu değerlendirme mekanizmaları ve hibrit veri etiketleme tekniklerinin daha fazla desteklenmesi hedeflenmektedir. Şirket, YZ sistemlerinde güvenilirlik, şeffaflık ve veri temsili gibi konulara odaklanan veri merkezli geliştirme anlayışını sürdürmektedir.