Arthur AI, yapay zekâ modellerinin değerlendirilmesi, izlenmesi, güvenliğinin sağlanması ve performansının artırılması amacıyla geliştirilmiş, çok yönlü çözümler sunan bir yapay zekâ platformudur. Şirket, özellikle büyük dil modelleri (LLM), doğal dil işleme (NLP), görsel tanıma (CV) ve tablo verisi tabanlı modeller gibi farklı yapay zekâ türlerinin denetlenebilirliğini ve güvenilirliğini artırmayı hedeflemektedir. Platform, açık kaynaklı araçları, özelleştirilebilir güvenlik sistemleri ve kurumsal düzeyde gözlemlenebilirlik özellikleri ile kurumların yapay zekâ çözümlerini üretim ortamında güvenli ve etkin şekilde kullanmalarını sağlamayı amaçlamaktadır.
Kuruluş
Arthur AI, yapay zekâ sistemlerinin üretim ortamlarında daha güvenli, şeffaf ve etkili biçimde çalışmasını sağlamak amacıyla kurulmuştur. Şirketin kurucuları arasında Adam Wenchel (CEO) ve John Dickerson (Chief Scientist) yer almaktadır. John Dickerson aynı zamanda Maryland Üniversitesi Bilgisayar Bilimleri Bölümü'nde öğretim üyesidir ve yapay zekâ ile ekonomi arasındaki kesişim alanında akademik çalışmalarıyla tanınmaktadır. Arthur AI’nin kuruluş süreci, özellikle büyük dil modelleri ve karmaşık makine öğrenimi sistemlerinin şeffaflık, performans ve güvenlik konularında artan kurumsal ihtiyaçlara yanıt verme amacına dayanır. Şirketin merkezi Amerika Birleşik Devletleri’nde bulunmaktadır ve yatırımcıları arasında Acrew, Greycroft, Index Ventures, Homebrew, Plex Capital ve Ame Cloud Ventures gibi risk sermayesi şirketleri yer almaktadır. Şirket, kuruluşundan itibaren açık kaynaklı ürün geliştirme, araştırma temelli inovasyon ve kurumsal düzeyde yapay zekâ çözümleri sunma odaklı bir strateji benimsemiştir.
Genel Özellikler ve Ürünler
Arthur AI platformu; performans izleme, veri kayması tespiti, açıklanabilirlik, önyargı azaltımı, gerçek zamanlı koruma, model kıyaslaması ve sohbet arayüzleri gibi çeşitli özellikler sunmaktadır. Platformun ana bileşenlerinden bazıları şunlardır:
Arthur Engine
Arthur Evals Engine, açık kaynak kodlu bir değerlendirme motorudur. Kullanıcılar, Docker 【1】 destekli bir kurulumla motoru çalıştırabilir ve yapay zekâ modellerini doğruluk, önyargı, adillik ve toksisite gibi çoklu metriklerle değerlendirebilir. Gerçek zamanlı değerlendirme yeteneği sunan bu motor, üretim ortamında model davranışlarını gözlemleme imkânı sağlar. Ayrıca, hassas veri sızıntısı, halüsinasyon, prompt enjeksiyonu ve toksik dil üretimi gibi olgular için yapılandırılabilir koruma sistemleri içerir.
Arthur Shield
Shield, büyük dil modelleri için geliştirilen bir güvenlik duvarıdır. Bu sistem, uygulama katmanı ile dağıtım katmanı arasında çalışarak kullanıcı girdilerini ve model çıktılarının güvenliğini denetler. OpenAI gibi farklı sağlayıcılarla uyumlu şekilde çalışan Shield, gerçek zamanlı olarak hassas veri sızıntısı, halüsinasyon, toksik çıktı ve kötü niyetli prompt enjeksiyonlarını algılayıp engellemeye yönelik çözümler sunar. Model ve platform bağımsız olması sayesinde farklı altyapılara kolaylıkla entegre edilebilir.
Arthur Bench
Bench, büyük dil modellerinin karşılaştırmalı olarak değerlendirilmesini sağlayan açık kaynaklı bir çözümdür. Şirketlerin farklı LLM alternatiflerini maliyet, gizlilik ve performans gibi kriterlere göre analiz edebilmesine olanak tanır. Kullanıcılar, özetleme kalitesi, halüsinasyon oranı gibi hazır metrikleri kullanabileceği gibi, kendi özel metriklerini de sisteme entegre edebilir. Bench arayüzü, model sonuçlarını kolayca görselleştirme ve kıyaslama imkânı sunar. Hem yerel hem de bulut tabanlı sürümleri mevcuttur.
Arthur Scope
Scope, NLP, CV, LLM ve tabular model türleri için geliştirilmiş kapsamlı bir performans izleme sistemidir. Veri kayması ve doğruluk kayıplarını tespit etmek, açıklanabilirlik sağlamak, model çıktılarında adalet ve önyargı değerlendirmesi yapmak amacıyla kullanılır. Gerçek zamanlı uyarı sistemi sayesinde olası performans sorunları önceden bildirilebilir. Platformun mikroservis mimarisi, kurumsal düzeyde ölçeklenebilirlik sağlar.
Arthur Chat
Chat, kuruluşların kendi belge ve verileri üzerine inşa edebilecekleri özel yapay zekâ sohbet uygulamaları geliştirmelerine olanak tanır. Sistem, kullanıcıya özel veri kaynaklarıyla desteklenir ve Arthur Shield ile entegre çalışarak güvenli bir deneyim sunar. Chat, hızlı kurulum ve özelleştirme seçenekleriyle işletmelerin üretkenliğini artırmaya yönelik tasarlanmıştır.
Model Türleri ve Uygulama Alanları
Arthur AI, farklı model türleri için özelleştirilmiş çözümler geliştirmiştir:
Recommender Systems (Öneri Sistemleri): Kişiselleştirilmiş öneri motorları için doğruluk, veri kayması ve önyargı analizi sunar. Segment bazlı analiz ve sebep-sonuç ilişkileri üzerinden hataların nedenlerini belirlemeye yönelik açıklanabilirlik özellikleri içerir.
Tabular Modeller: Tablo verisi kullanan modeller için otomatik anomali tespiti, açıklanabilirlik, önyargı azaltımı ve performans görselleştirme özellikleri sağlar.
Computer Vision (Görsel Tanıma): Görsel sınıflandırma ve nesne tanıma uygulamalarında açıklanabilirlik ve hata analizi için görüntü bölgesi bazlı değerlendirme imkânı sunar. Görsel verilerdeki önyargıların tespiti de sistem tarafından desteklenir.
Natural Language Processing (Doğal Dil İşleme): NLP modelleri için bilgi çıkarımı doğruluğunu izleme, veri kayması analizi, açıklanabilirlik teknikleri ve belge içeriği bazlı tahmin açıklamaları sağlar.
Araştırma ve Geliştirme
Arthur AI, ürün geliştirme sürecinde araştırma temelli bir yaklaşım izlemektedir. Şirketin baş bilim insanı John Dickerson, yapay zekâ ve ekonomi alanlarının kesişiminde çalışmalar yürütmektedir. Arthur AI bünyesinde yürütülen Araştırma Bursiyerleri Programı kapsamında, çeşitli üniversitelerden araştırmacılar yapay zekâ güvenliği, adil modelleme ve açıklanabilirlik konularında projelere katkı sunmaktadır. Şirket, adil sınıflandırma, karşıt açıklamalar, model davranışı izleme ve büyük dil modeli değerlendirme yöntemleri gibi başlıklarda bilimsel yayınlar üretmektedir.
Organizasyon ve Liderlik
Arthur AI'nin kurucu ortağı ve CEO’su Adam Wenchel, şirketin vizyonunu yönetmektedir. Bilimsel liderliği John Dickerson üstlenirken, mühendislik, ürün yönetimi ve müşteri destek ekiplerinde çeşitli deneyimli isimler görev yapmaktadır. Şirketin yatırımcıları arasında Acrew, Greycroft, Index Ventures, Work Bench, Homebrew ve Plex Capital gibi girişim sermayesi firmaları yer almaktadır. Arthur AI, üretim ortamında kullanılan yapay zekâ modellerinin izlenmesi, güvenliğinin sağlanması, açıklanabilirliğinin artırılması ve performansının optimize edilmesine yönelik araçlar sunan bütüncül bir platformdur. Açık kaynaklı bileşenleri, ölçeklenebilir mimarisi ve model türü bağımsız çözümleri ile çeşitli sektörlerdeki kurumsal yapay zekâ uygulamalarına destek sağlamaktadır.
Gelecek Vizyonu
Arthur AI, yapay zekâ sistemlerinin değerlendirilmesi, izlenmesi ve güvenliğinin sağlanmasına yönelik çözümler sunarken, uzun vadeli stratejisini bu sistemlerin tüm yaşam döngüsünü kapsayan bir kontrol altyapısı geliştirmek üzerine kurmaktadır. Şirketin odaklandığı alanlar arasında model gözlemlenebilirliği, güvenlik duvarları, açıklanabilirlik mekanizmaları, önyargı tespiti ve performans analizleri yer almaktadır. Geleceğe yönelik planlar arasında, açık kaynaklı bileşenlerin kullanıcı toplulukları tarafından geliştirilmesine olanak sağlamak, kullanıcıların özel metrik ve analiz sistemleri oluşturmasına imkân tanımak ve sektörlere özgü veri yapıları için özelleştirilebilir izleme çözümleri sunmak bulunmaktadır. Ayrıca, yapay zekâ sistemlerinin mevzuatlara ve etik ilkelere uygun biçimde işletilmesine yönelik iş birliklerinin artırılması hedeflenmektedir.