VAST Data, yapay zekâ (AI), yüksek başarımlı hesaplama ve kurumsal veri yönetimi için geliştirilmiş birleşik bir veri altyapısı platformudur. 2016 yılında kurulan şirketin genel merkezi New York, ABD’dedir. VAST Data, geleneksel katmanlı depolama mimarilerine karşı yeni bir yaklaşım sunarak, tüm veri türlerini tek bir katmanda, yüksek performans ve düşük maliyetle yönetmeyi hedefleyen bir altyapı mimarisi geliştirmiştir. Şirketin sunduğu bu mimari “DASE” (Disaggregated, Shared-Everything – Ayrıştırılmış, Paylaşılan-Her Şey) olarak adlandırılmaktadır.
Kurucular
Renen Hallak: VAST Data’nın CEO’sudur (İcra Kurulu Başkanı - Chief Executive Officer). Daha önce EMC'de XtremIO projesinde çalışmıştır. Ölçeklenebilirlik, dayanıklılık ve veri performansı üzerine uzmanlığı ile şirketin teknik vizyonunu şekillendirmiştir.
Shachar Fienblit: Şirketin kurucu ortağı ve ilk CTO’sudur (Teknoloji Grup Başkanı - Chief Technology Officer). Mühendislik alanında geniş deneyime sahip olan Fienblit, VAST’ın mimarisinin yazılım altyapısını tasarlamıştır.
Jeff Denworth: Kurucu ortaklardan biridir ve pazarlama stratejilerinden sorumludur. Daha önce DDN (DataDirect Networks) gibi firmalarda pazarlama ve ürün yönetimi alanlarında görev almıştır.
DASE Mimarisi
DASE mimarisi, Google’ın 20 yıl önce sunduğu “shared-nothing” (paylaşımsız) sistem yaklaşımına bir alternatif olarak tasarlanmıştır. Bu mimari, işlemci mantığını sistem durumundan ayırarak, tüm kümeye ortak ve işlemsel veri yapıları üzerinden erişim sağlar. Böylece işlemciler ve veri depolama birimleri birbirinden bağımsız ölçeklenebilir hâle gelir. DASE, işlem gücü ile veri kapasitesini ayrı ayrı yönetmeye izin verirken, veri erişimi açısından ise “shared-everything” (her şey paylaşımlı) yaklaşımı benimser.
Temel Bileşenler ve Teknolojiler
VAST Data platformunun temel bileşenleri şunlardır:
- VAST DataStore: ACID (Atomicity, Consistency, Isolation, Durability – Atomiklik, Tutarlılık, İzolasyon, Kalıcılık) garantili, yüksek performanslı ve çok protokollü (NFS, SMB, S3) bir veri depolama altyapısıdır. Veriler dosya, nesne, tablo gibi biçimlerde erişilebilir.
- VAST DataSpace: Kenar (edge) bilişimden bulut ortamına kadar uzanan küresel ad alanı sağlar. Dağıtık kilitleme ihtiyacını ortadan kaldırarak, çok lokasyonlu küme yapılarını düşük gecikmeyle çalıştırır.
- VAST DataBase: OLTP (Online Transaction Processing – Çevrim İçi İşlem İşleme) ve OLAP (Online Analytical Processing – Çevrim İçi Analitik İşleme) sistemlerini birleştiren, işlem ve analiz iş yüklerini aynı ortamda işleyebilen bir veri tabanı katmanıdır.
- VAST DataEngine: Veri üzerinde olay tetikleyicileri, kullanıcı tanımlı işlevler (UDF) ve mantıksal sorgular ile gerçek zamanlı işleme sağlar.
- Gemini: VAST platformunun yazılımının müşterilere donanımdan bağımsız bir biçimde lisanslandığı bir tüketime dayalı modeldir. Donanım, doğrudan üretici ortaklardan temin edilebilir.
DASE ile Performans
DASE mimarisi, geleneksel sistemlerde karşılaşılan doğu-batı trafiğini ortadan kaldırarak, işlemcilerin birbirleriyle kilit eşgüdümü gerektirmeksizin çalışmasına olanak tanır. Bu sayede sistem, petabayt ölçeğinden eksabayt ölçeğine kadar kesintisiz olarak büyütülebilir.
VAST Element
VAST platformunda veriler, “VAST Element” adı verilen birimler hâlinde tutulur. Her bir element; dosya, nesne, tablo, işlev gibi farklı biçimlerde tanımlanabilir ve zengin meta verilerle donatılmıştır. Bu yapı sayesinde aynı veri çoklu protokollerle ve uygulama biçimleriyle erişilebilir hâle gelir.
VAST, “write-in-free-space” (boş alana yazım) yöntemiyle çalışan, tutarlı ve atomik veri yapıları sayesinde performansı etkilemeden saniyelik aralıklarla alınabilen anlık görüntüler sağlar. Bir VAST kümesi, aynı anda 1 milyon anlık görüntüyü destekleyebilir.
VAST Data, klasik Reed-Solomon algoritmalarının yerine geliştirdiği “LDEC” (Locally-Decodable Erasure Code – Yerel Kod Çözülebilir Bozulma Kodlama) teknolojisiyle, %2,7 oranında hata düzeltme yüküyle çok daha hızlı yeniden yapılandırma süreçleri sunar. Bu yaklaşım, yüksek dayanıklılık sağlarken veri geri yükleme sürelerini ciddi ölçüde azaltır.
Similarity adlı veri küçültme algoritması, hem küresel tekrarları hem de yerel sıkıştırmayı aynı anda uygulayarak, önceden sıkıştırılmış veya şifrelenmiş verilerde bile anlamlı veri azaltımı sağlar. Ortalama olarak 3:1 oranında veri küçültme elde edilmektedir.
Kullanım Alanları
VAST platformu, yapay zekâ eğitiminden genomik analizlere, video işleme hatlarından finansal modellemeye kadar geniş bir kullanım alanına sahiptir. VAST; NASA, Zoom, Pixar, NIH (Ulusal Sağlık Enstitüleri), Allen Institute, US Air Force ve CoreWeave gibi kurumlar tarafından tercih edilmektedir.
Verimlilik
VAST Data, düşük maliyetli QLC (Quad-Level Cell – Dört Seviyeli Hücre) SSD’leri 10 yıl garantili bir biçimde kullanacak şekilde optimize edilmiş ve yazma çoğalması gibi dayanıklılık problemlerini çözen altyapı geliştirmiştir. Ayrıca sistem, çok katmanlı yapıları ortadan kaldırarak, tüm veriyi tek bir katmanda gerçek zamanlı olarak erişilebilir kılar.
Gelecek Perspektifi
IDC, VAST Data’nın DASE mimarisini “geleceğin mimarisi” olarak nitelendirmektedir. Platform, YZ çağı için tasarlanmış birleşik bir altyapı yaklaşımı ile veri yönetimini basitleştirmekte ve geleneksel sistemlerin ölçeklenebilirlik, performans ve maliyet sınırlamalarını aşmaktadır. Gelecekteki gelişmelerde, özellikle dağıtık öğrenme sistemleri, kenar-bulut iş birlikleri ve otomatikleştirilmiş yapay zekâ veri işlem hatları için DASE mimarisinin merkezi rol oynaması beklenmektedir.