logologo

Veri Ambarı

Bilişim Ve İletişim Teknolojileri+1 Daha
fav gif
Kaydet
viki star outline

Veri ambarı (Data Warehouse), işletmelerin farklı sistemlerinden gelen büyük miktardaki veriyi tek bir merkezi depoda toplayarak analiz edilmesini sağlayan bir bilgi yönetim sistemidir. Bu sistemler, özellikle karar destek sistemleri ve iş zekası uygulamaları için kritik bilgiler sunmaktadır.


Veri Ambarı Temel Mimarisi (Kredi: veribilimiokulu.com)


Veri Ambarının Temel Özellikleri

Veri ambarlarını geleneksel veritabanlarından ayıran bazı temel özellikler bulunmaktadır:


  • Konu Odaklıdır: Veri ambarları belirli bir iş alanına (örneğin satış, finans, müşteri ilişkileri) odaklanır ve bu konularla ilgili bilgileri toplar.
  • Entegre Edilmiştir: Farklı kaynaklardan gelen veriler, ortak bir formatta entegre edilerek tutarlı hale getirilir.
  • Zamana Duyarlıdır: Veri ambarları genellikle tarihsel verileri içerir, bu sayede uzun vadeli analizler yapılabilir.
  • Değişmezdir (Non-volatile): Veri ambarına bir kez kaydedilen veri değiştirilmez veya silinmez, yalnızca ekleme yapılabilir. Bu, güvenilir analizler için verinin bütünlüğünü korur.
  • Büyük Hacimli Veri Depolayabilir: Şirketlerin yıllar boyunca biriktirdiği verileri depolayarak, büyük ölçekli analizler yapılmasını mümkün kılar.


Veri Ambarlarının Amacı

Veri ambarlarının temel amacı, farklı sistemlerden gelen verileri entegre ederek şirketlerin daha doğru ve bilinçli kararlar almasını sağlamaktır. Bu amaca hizmet eden bazı kullanım alanları şunlardır:


  • Karar Destek Sistemleri: Yöneticilerin stratejik kararlar almasını kolaylaştırır.
  • İş Zekası: Verileri analiz ederek geleceğe yönelik tahminlerde bulunmayı sağlar.
  • Operasyonel Verimlilik: Verileri merkezi bir yapıda saklayarak bilgiye erişimi hızlandırır.
  • Müşteri Analizleri: Müşteri alışkanlıklarını analiz ederek pazarlama stratejilerini optimize etmeye yardımcı olur.


Veri ambarları, büyük ölçekli şirketlerden küçük işletmelere kadar birçok kuruluş için önemli bir araç haline gelmiştir. Günümüzde bulut tabanlı çözümlerle birlikte, veri ambarları daha erişilebilir ve ölçeklenebilir hale gelmiştir.


Veri Ambarı Bileşenleri

1. Veri Kaynağı Katmanı (Data Source Layer): İşletmenin farklı bölümlerinden gelen veriler bu katmanda toplanır. Bu veriler, işletimsel veritabanlarından (Oracle, MySQL), CRM sistemlerinden (Salesforce, Hubspot), web sitelerinden (Google Analytics) ve sensörler gibi çeşitli kaynaklardan gelir. Bu katman, verinin çeşitli kaynaklardan gelen ilk durak noktasıdır.


2. Veri Alma Katmanı (Data Ingestion Layer): Bu katmanda, toplanan veriler temizlenir, dönüştürülür ve veri ambarına yüklenir. Bu işlemler genellikle ETL (Extract, Transform, Load) araçları (Informatica, Talend) ile gerçekleştirilir. Bu katman, verinin analize uygun bir hale getirilmesini sağlar.


3. Veri Depolama Katmanı (Data Storage Layer): Veri ambarına yüklenen veriler bu katmanda depolanır. Bu katman, verinin güvenli ve düzenli bir şekilde saklanmasını sağlar.


4. Veri Erişim Katmanı (Data Access Layer): Bu katman, kullanıcıların veri ambarındaki verilere erişmesine olanak sağlar. Bu erişim genellikle SQL sorguları, raporlama araçları (Tableau, Power BI) ve analitik araçlar (R, Python) aracılığıyla gerçekleştirilir. Bu katman, veriye erişimin kolay ve hızlı olmasını sağlar.


5. Meta Veri Katmanı (Metadata Layer): Bu katmanda, veri ambarı hakkındaki bilgiler depolanır. Burada verilerin anlamı, kökeni ve kullanımı hakkında bilgiler saklanır. Meta veri yönetim araçları (IBM InfoSphere, Informatica Metadata Manager) kullanılır. Bu katman, verinin anlamını ve kaynağını anlamak için gereklidir.


6. Veri İşleme Katmanı (Data Processing Layer): Bu katmanda, toplanan veriler analiz edilir ve dönüştürülür. Burada genellikle makine öğrenimi ve yapay zeka modelleri (TensorFlow, PyTorch) kullanılır. Bu katman, veriden bilgi çıkarmak için gereklidir.


7. Sunum Katmanı (Presentation Layer): Bu son katmanda, kullanıcılara veri ambarındaki veriler görsel olarak sunulur. Grafikler, çizelgeler ve gösterge panoları gibi araçlar (Tableau, Power BI) kullanılır. Bu katman, verinin son kullanıcıya ulaştığı yerdir ve veriyi anlamak için görsel araçlar sağlar.


Veri Ambarı Mimari Yaklaşımları

Veri ambarı, birleşik bir şema altında düzenlenen farklı veri kaynaklarının heterojen bir koleksiyonudur. Veri ambarı oluşturmada 2 yaklaşım vardır: Inmon Yaklaşımı (Top-Down Approach) ve Kimball Yaklaşımı (Bottom-Up Approach).


Inmon Yaklaşımı (Top-Down Approach)

Bu yaklaşım, kurumsal veri modeline dayanarak genellikle bir veri ambarını inşa etmeyi öngörür. İlk olarak, tüm veri unsurlarını kapsayan ve kurumun genel işleyişini yansıtan tek ve kapsamlı bir veri ambarı oluşturulur. Bu veri ambarı, kurumun tüm veri ihtiyaçlarını karşılayacak şekilde tasarlanır. Oluşturulan bu veri ambarının ardından, belirli işlevsel alanlara veya belirli iş süreçlerine yönelik data mart oluşturulur. Bu data mart, genel veri ambarından alınan verileri kullanarak, belirli işlevsel alanların veya iş süreçlerinin veri ihtiyaçlarını karşılar.


Inmon Model (Kredi: veribilimiokulu.com)


Kimball Yaklaşımı (Bottom-Up Approach)

Bu özgün ve etkili yaklaşım, veri yönetiminde belirli iş alanlarına hizmet eden özel data martlar oluşturmayı içerir. Bu data martların, her biri belirli bir iş alanına odaklanarak bilgiyi organize eder ve işlemeye hazır hale getirir. Daha sonra, geniş bir veri ambarını oluşturmak için birleştirilir. Bu, genellikle daha hızlı ve daha etkili sonuçlar verirken aynı zamanda sistemin genel esnekliğini artırır. Kimball yaklaşımı, işletmelerin hızlı bir şekilde değer elde etmek ve ihtiyaç duydukları bilgilere hızlı bir şekilde erişmek için kullanabileceği bir yöntemdir.


Kimball Model (Kredi: veribilimiokulu.com)


Veri Ambarı Kullanım Alanları

Veri ambarları, çeşitli sektörlerde yaygın olarak kullanılmaktadır:


  • Finans Sektörü: Risk analizi, sahtekarlık tespiti, yatırım kararlarının desteklenmesi.
  • Sağlık Sektörü: Hasta kayıtlarının analiz edilmesi, hastalık trendlerinin belirlenmesi, sağlık hizmetlerinin iyileştirilmesi.
  • Perakende: Müşteri alışkanlıklarını analiz etme, stok yönetimi, satış trendlerinin belirlenmesi.
  • Eğitim: Akademik performans analizi, öğrenci başarı oranlarının incelenmesi, eğitim politikalarının geliştirilmesi.
  • Telekomünikasyon: Kullanıcı davranışlarının analizi, ağ optimizasyonu, müşteri memnuniyetinin artırılması.


Veri Ambarı ve Büyük Veri İlişkisi

Geleneksel veri ambarı yapıları, yapılandırılmış veriler için optimize edilmiştir. Ancak büyük veri (Big Data) ile birlikte, yapılandırılmamış ve yarı yapılandırılmış verileri de analiz etme ihtiyacı ortaya çıkmıştır. Veri ambarları, Hadoop, Spark gibi büyük veri teknolojileriyle entegre edilerek daha geniş veri işleme kapasitesine kavuşturulmuştur.


Veri Ambarı ile Büyük Veri Arasındaki Farklar

Yapay zeka araçları ile oluşturulmuştur.


Veri Ambarı Tipleri

Veri ambarı teknolojisi genellikle üç ana kategoriye ayrılır; her biri belirli bir işlevi yerine getirir ve birbirini tamamlar. Bir e-ticaret şirketinin veri ambarını örnek olarak alırsak, veri ambarı tiplerini aşağıdaki gibi tanımlayabiliriz:


Operasyonel Veri Ambarı (ODS): ODS’nin amacı günlük işlemleri hızlandırmaktır. ODS, e-ticaret platformunun günlük işlemlerinden gelen verileri yakalar ve depolar. Bu veriler, siparişler, müşteriler, ürünler ve ödemeler gibi kritik bilgileri içerir. ODS sayesinde aşağıdaki sorgulamaları hızlıca yapabiliriz:


  • Sipariş durumunu izleme
  • Stok seviyelerini yönetme
  • Müşteri davranışlarını analiz etme
  • Dolandırıcılık tespiti


Kurumsal Veri Ambarı (EDW): EDW, şirketin tüm verisini saklar. Şirketin geçmiş performansını analiz etmesine ve gelecekteki trendleri tahmin etmesine olanak sağlar. EDW, ODS’ye kıyasla daha fazla veri saklayabilir ve daha karmaşık analizler gerçekleştirebilir. Bu, şirketin daha geniş bir bakış açısıyla faaliyetlerini değerlendirmesine ve stratejik kararlar vermesine yardımcı olur. EDW, aşağıdakiler gibi karmaşık sorguları ve analizleri destekler:


  • Satış trendlerini analiz etme
  • Müşteri segmentasyonu ve hedefleme
  • Pazarlama kampanyalarının etkinliğini değerlendirme
  • Ürün yelpazesini optimize etme


Data Mart: Data Mart, EDW’den belirli bir konuya odaklanan veri kümelerini ayıklar ve analiz için optimize eder. Örneğin, bir pazarlama datamart, müşteriler, satın alma geçmişleri ve demografik bilgiler gibi verileri içerebilir. Bu, pazarlama departmanının aşağıdakileri yapmasına olanak tanır:


  • Pazarlama kampanyalarının performansını analiz etme
  • Müşteri segmentasyonu ve hedefleme
  • Kişiselleştirilmiş pazarlama mesajları oluşturma

Kaynakça

Hewlett Packard Enterprise. "What is a Data Warehouse?" Erişim Adresi.


Kayademir, Seda. "Veri Ambarı Nedir?" (2024). Erişim Adresi.


Microsoft Documentation. "What is a data warehouse?" Erişim Adresi.


IBM. "What is a data warehouse?" (2024). Erişim Adresi.


SEKER, Sadi Evren. Veri Ambarı (Data Warehouse). YBS Ansiklopedi 2, no. 4, (2015): 7-13. Erişim Adresi.


Baykal, Abdullah. "Veri madenciliği uygulama alanları." Dicle Üniversitesi Ziya Gökalp Eğitim Fakültesi Dergisi 7, (2006): 95-107. Erişim Adresi.

Sen de Değerlendir!

0 Değerlendirme

Yazar Bilgileri

Avatar
Ana YazarBeyza Nur Türkü12 Şubat 2025 10:04
KÜRE'ye Sor