Yüksek başarımlı hesaplama (HPC – High Performance Computing) sistemleri, bilimsel araştırmalar, simülasyonlar ve veri yoğun mühendislik uygulamaları gibi alanlarda kritik bir rol oynamaktadır. Bu sistemlerde işlem kaynaklarının verimli kullanımı için gelişmiş iş sıralayıcı ve zamanlayıcı sistemlerine ihtiyaç duyulur. Slurm (Simple Linux Utility for Resource Management), bu alanda öne çıkan açık kaynaklı bir iş sıralama ve kaynak yönetim sistemidir.
Slurm, başlangıçta Hewlett-Packard tarafından geliştirilen ve günümüzde SchedMD tarafından sürdürülen açık kaynaklı bir kaynak yönetimi ve iş zamanlayıcı yazılımıdır. Slurm, Linux temelli küme sistemlerinde görevlerin (job) yönetimini sağlar. Binlerce düğümden (node) oluşan süper bilgisayarlarda, kullanıcıların işlerini adil ve verimli şekilde sıraya koymak, zamanlamak ve kaynaklara erişimini sağlamak amacıyla kullanılır.
Slurm, büyük ölçekli sistemler için tasarlanmış olmasına rağmen, orta ölçekli araştırma kümelerinde de yaygın olarak kullanılmaktadır.
Slurm mimarisi, aşağıdaki ana bileşenlerden oluşur:
Slurm, farklı zamanlama politikalarını destekleyerek işler arasında adil kaynak paylaşımı sağlar. Örneğin, Priority, Backfill, FairShare gibi stratejilerle işler sıraya konulur. Kullanıcılar sbatch, srun, salloc gibi komutlarla işleri gönderebilir ve squeue, sacct ile iş durumu takip edilebilir.
Slurm, çok çekirdekli ve çok düğümlü görevleri destekler, MPI (Message Passing Interface) gibi dağıtık iş yüklerinin koordine çalışmasını kolaylaştırır.
Slurm, eklentiler aracılığıyla genişletilebilir. Örneğin:
Ayrıca, Slurm’un yapılandırma dosyaları (slurm.conf, gres.conf, cgroup.conf vb.) üzerinden donanım kaynakları detaylı biçimde tanımlanabilir.
Slurm, dünyanın en büyük süperbilgisayarlarında (örneğin TOP500 listesinde yer alan sistemlerde) başarıyla kullanılmaktadır. On binlerce düğüm ve milyonlarca iş örneğini eşzamanlı olarak yönetebilecek performans kabiliyetine sahiptir.
Slurm, yüksek başarımlı bilgi işlem sistemlerinde iş yönetimi ve kaynak planlamasını sağlamak için kullanılan güçlü, açık kaynaklı ve esnek bir platformdur. Akademik ve kurumsal araştırma ortamlarında yaygın olarak tercih edilmekte, dünya genelindeki süper bilgisayar merkezlerinin çoğunda varsayılan sistem olarak yer almaktadır.
Slurm Nedir?
Temel Bileşenler
Kullanım Alanları
İş Zamanlama ve Kuyruklama
Özelleştirme ve Genişletilebilirlik
Performans ve Ölçeklenebilirlik
Slurm ile Diğer Sistemlerin Karşılaştırması
This article was created with the support of artificial intelligence.