KÜRE LogoKÜRE Logo
Ai badge logo

Bu madde yapay zeka desteği ile üretilmiştir.

DeepSeek R1

fav gif
Kaydet
kure star outline

DeepSeek R1, 20 Ocak 2025 tarihinde piyasaya sürülen bir büyük dil modeli (LLM) ve yapay zeka tabanlı sohbet asistanıdır. Çin merkezli DeepSeek tarafından geliştirilmiştir. Model, açık kaynak kodlu olarak kullanıma sunulmuştur.


DeepSeek logosu - Arbisoft


DeepSeek R1, High-Flyer Capital Management fonunun desteğiyle geliştirilen DeepSeek şirketi tarafından oluşturulmuştur. Modelin geliştirilme sürecinde 2 bin Nvidia çipi kullanılmış ve yaklaşık 5,6 milyon dolar maliyetle üretildiği belirtilmiştir. Bu durum, daha az çip ve daha düşük maliyetle eğitilen bir yapay zeka modeli olarak sektörde dikkat çekmesine neden olmuştur.

Modelin Temel Özellikleri

DeepSeek R1, "akıl yürütme" (reasoning) yeteneklerine sahip bir model olarak tanımlanmaktadır. Model, matematik, kodlama ve mantık problemlerinde güçlü sonuçlar üretmek üzere tasarlanmış olup büyük dil modellerinin genel yeteneklerine sahiptir.

Açık kaynaklı: DeepSeek R1'in temel modelinin açık kaynaklı olması, araştırmacıların ve geliştiricilerin model üzerinde çalışmalar yapmasına olanak tanımaktadır.

Düşük maliyet ve verimli çip kullanımı: Modelin geliştirilmesinde rakiplerine kıyasla daha az sayıda çip kullanılmış ve daha düşük maliyetle eğitildiği belirtilmiştir.

Doğal dil işleme (NLP) yetenekleri: Model, dil anlama, metin oluşturma, çeviri ve özetleme gibi çeşitli doğal dil işleme görevlerinde kullanılabilmektedir.

Geliştirme Süreci

DeepSeek R1, DeepSeek şirketinin ilk büyük dil modeli (LLM) olarak geliştirilmiştir. Model 20 Ocak 2025’te piyasaya sürülmüştür. Model, açık kaynak kodlu olarak yayınlanarak, küresel çapta araştırmacıların ve geliştiricilerin erişimine sunulmuştur. 


DeepSeek R1’in geliştirilme sürecinde 2 bin adet Nvidia çipi kullanılmıştır. Modelin eğitimi için harcanan toplam maliyetin yaklaşık 5,6 milyon dolar olduğu belirtilmiştir. Bu maliyet, sektördeki benzer büyük dil modelleriyle kıyaslandığında oldukça düşük bir seviye olarak kaydedilmiştir.

OpenAI’ın GPT-4 modelinin eğitimi için 16 bin çiple beraber 100 milyon doların üzerinde bir bütçe ayrıldığı ifade edilirken, DeepSeek R1’in çok daha düşük maliyetle geliştirilmiş olması, yapay zeka alanındaki verimlilik konularında yeni tartışmalara yol açmıştır.


DeepSeek R1 akıl yürütme yeteneğini kullanarak yanıt veriyor. - DeepSeek


Teknik Özellikler

Modelin Mimarisi ve Kullanılan Teknolojiler

DeepSeek R1, büyük dil modelleri (LLM) sınıfına giren bir doğal dil işleme (NLP) modelidir. Modelin mimarisi ve teknik detayları hakkında kamuya açıklanan bilgiler sınırlı olmakla birlikte, transformer tabanlı bir yapıya sahip olduğu belirtilmiştir.


Modelin, OpenAI’ın GPT-4, Google’ın Gemini ve Meta’nın LLaMA modelleriyle kıyaslanabilecek seviyede akıl yürütme (reasoning) yeteneklerine sahip olduğu ifade edilmiştir. DeepSeek R1, adım adım akıl yürütme (step-by-step reasoning) yaklaşımı ile çalışarak, karmaşık problemleri çözerken daha tutarlı ve mantıklı çıktılar üretebilmesi için tasarlanmıştır.


Ayrıca, modelin hafıza yönetimi ve hesaplama verimliliği konusunda optimizasyonlar içerdiği belirtilmiştir. Özellikle daha düşük çip kullanımına rağmen yüksek doğruluk oranlarına ulaşabilmesi, optimize edilmiş parametre yönetimi ve hafifletilmiş model boyutu sayesinde mümkün olmuştur.

Eğitim Süreci ve Kullanılan Veri Setleri

DeepSeek R1’in eğitimi için kullanılan veri setleri hakkında resmi ve kapsamlı bilgiler paylaşılmamıştır. Modelin geniş çaplı çok dilli veri setleri ve programlama dilleri ile eğitildiği belirtilmektedir. Bununla birlikte, DeepSeek R1’in Çin’de geliştirilmiş olması nedeniyle, Çin hükümetinin içerik politikalarına uygun olacak şekilde belirli sansür mekanizmaları ile çalıştığı kullanıcı raporlarıyla tespit edilmiştir.

Güvenlik ve Siber Saldırılar

DeepSeek'in Karşılaştığı Büyük Ölçekli Siber Saldırılar

DeepSeek R1’in piyasaya sürülmesinin ardından, 27 Ocak 2025 tarihinde modelin web tabanlı hizmetlerine yönelik büyük ölçekli siber saldırılar gerçekleştirildiği bildirilmiştir. Şirket, bu saldırıların kötü niyetli aktörler tarafından organize edildiğini ve hizmet sürekliliğini etkileyebilecek ciddi güvenlik tehditleri oluşturduğunu açıklamıştır.


Saldırılar sonrası şirketin resmi internet sitesinde "DeepSeek hizmetlerine yönelik büyük ölçekli kötü amaçlı saldırılar nedeniyle hizmet devamlılığı için kayıtları geçici olarak kısıtlıyoruz." şeklinde bir bildirim yayımlanmıştır. Bu saldırıların teknik detayları ve kimler tarafından gerçekleştirildiği konusunda kamuya açık net bir açıklama yapılmamıştır.


DeepSeek’in web platformu, siber saldırılar nedeniyle erişim problemleri ve kesintiler yaşamıştır. Ocak 2025 kullanıcı raporlarına göre, bazı bölgelerde hizmet yavaşlamış, bazı bölgelerde ise tamamen kesilmiştir.


Mobil uygulamalar üzerinde herhangi bir kısıtlama getirilmemiş ve uygulama mağazalarında kullanıcı sayısında artış devam etmiştir. DeepSeek'in uygulaması, Çin ve ABD pazarlarında popülerliğini korumuştur.

Piyasa Etkisi

DeepSeek R1’in piyasaya sürülmesi, küresel teknoloji hisselerinde dalgalanmalara neden olmuştur. ABD merkezli teknoloji şirketleri, modelin düşük maliyetle geliştirilmesi ve daha az çip kullanılarak eğitilmesi nedeniyle rekabet avantajlarını sorgulamaya başlamıştır. Bu gelişmelerin ardından, Nasdaq endeksi %3'ün üzerinde değer kaybetmiş, çip üreticisi Nvidia’nın hisseleri %17 düşerek piyasa değerinde 500 milyar doları aşan bir kayıp yaşanmıştır. AMD, Qualcomm ve Micron Technology gibi yarı iletken şirketlerinin hisselerinde de düşüşler gözlemlenmiştir.

Modelin piyasaya sürülmesi, kullanıcılar tarafından büyük ilgi görmüş ve ABD ile Çin uygulama mağazalarında en çok indirilen yapay zeka uygulamalarından biri olmuştur. Apple App Store’da ChatGPT’yi geride bırakarak en fazla indirilen uygulama olmuş, Google Play Store’da da geniş bir kullanıcı kitlesine ulaşmıştır.

Küresel ve Politik Yansımalar

ABD Başkanı Donald Trump ve Diğer Liderlerin Açıklamaları

DeepSeek R1’in piyasaya sürülmesi ve ABD teknoloji hisselerinde yarattığı dalgalanmalar, Washington’da yapay zeka rekabeti konusunda yeni tartışmaları gündeme getirmiştir. ABD Başkanı Donald Trump, DeepSeek R1’in piyasaya sürülmesini "Amerikan yapay zeka sektörü için bir uyandırma çağrısı" olarak tanımlamıştır. Trump, ABD'li şirketlerin teknoloji liderliğini koruyabilmesi için devlet destekli büyük ölçekli yatırımlara ihtiyaç duyulduğunu vurgulamıştır.


Microsoft CEO’su Satya Nadella, DeepSeek’in verimliliğini "süper etkileyici" olarak nitelendirerek, ABD’nin Çin’in yapay zeka alanındaki başarısını ciddiye alması gerektiğini belirtmiştir. OpenAI CEO’su Sam Altman, DeepSeek R1’in düşük maliyetle geliştirilmiş olmasını etkileyici bulduğunu ancak modelin uzun vadeli sürdürülebilirliğinin test edilmesi gerektiğini ifade etmiştir.

Kaynakça

DeepSeek. Official Website. Erişim tarihi: 29 Ocak 2025. https://www.deepseek.com/.

Anadolu Ajansı. "Nvidia Calls DeepSeek’s R1 Model an ‘Excellent AI Advancement.’" Anadolu Ajansı, 27 Ocak 2025. https://www.aa.com.tr/en/economy/nvidia-calls-deepseek-s-r1-model-an-excellent-ai-advancement/3464061.

Reuters. "What Is DeepSeek and Why Is It Disrupting the AI Sector?" Reuters, 27 Ocak 2025. https://www.reuters.com/technology/artificial-intelligence/what-is-deepseek-why-is-it-disrupting-ai-sector-2025-01-27/.

Anadolu Ajansı. “Ucuza Mal Edilen Çinli Yapay Zeka Modeli DeepSeek Dünyanın Gündemine Oturdu.” Anadolu Ajansı, 27 Ocak 2025. https://www.aa.com.tr/tr/bilim-teknoloji/ucuza-mal-edilen-cinli-yapay-zeka-modeli-deepseek-dunyanin-gundemine-oturdu/3464570.

Anadolu Ajansı. “Teknoloji Hisseleri DeepSeek ile Sarsıldı.” Anadolu Ajansı, 27 Ocak 2025. https://www.aa.com.tr/tr/bilim-teknoloji/teknoloji-hisseleri-deepseek-ile-sarsildi/3463775.

The Guardian. “Chinese AI Chatbot DeepSeek Censors Itself in Real Time, Users Report.” The Guardian, 28 Ocak 2025. https://www.theguardian.com/technology/2025/jan/28/chinese-ai-chatbot-deepseek-censors-itself-in-realtime-users-report.

BBC News. “DeepSeek: The Chinese AI App That Has the World Talking.” BBC News, 28 Ocak 2025. https://www.bbc.com/news/articles/c5yv5976z9po.

CNN. “China Celebrates DeepSeek’s Breakout AI Success as Tech Race Heats Up.” CNN, 28 Ocak 2025. https://edition.cnn.com/2025/01/28/china/china-deepseek-ai-success-tech-intl-hnk/index.html.

Sen de Değerlendir!

0 Değerlendirme

Yazar Bilgileri

Avatar
Ana YazarEdanur Karakoç29 Ocak 2025 07:40
KÜRE'ye Sor