Deepgram, ses tanıma ve ses zekâsı teknolojileri geliştiren, merkezi Amerika Birleşik Devletleri’nde bulunan bir yapay zekâ şirketidir. 2015 yılında Scott Stephenson ve Adam Sypniewski tarafından kurulan Deepgram, sesli verilerden anlam çıkarma, konuşmayı metne çevirme (speech-to-text), metni sese dönüştürme (text-to-speech) ve sesli yapay zekâ ajanları oluşturma gibi alanlarda faaliyet göstermektedir. Şirketin teknolojisi, özellikle kurumsal kullanımlar için optimize edilmiş gerçek zamanlı ve düşük gecikmeli uygulamalara odaklanmaktadır.
Kuruluş
Deepgram, 18 Ağustos 2015 tarihinde kuruldu. Kurucu ortaklar Scott Stephenson ve Adam Sypniewski, daha önce Michigan Üniversitesi’nde karanlık madde üzerine fiziksel deneyler yürütürken ses dalgalarıyla analiz yapılmasına yönelik araştırmalar geliştirmiştir. Bu çalışmalar, sonradan konuşma verilerinin yapay zekâ aracılığıyla analiz edilmesi fikrine temel oluşturmuştur. 2016 yılında Y Combinator’dan yatırım alan Deepgram, ilk müşterilerini 2017’de elde etmiş, ardından 2019’da 12 milyon dolar değerinde Seri A yatırım ve 2020’de 25 milyon dolar Seri B yatırımı almıştır. 2022 yılında Seri B turuna ek olarak 72 milyon dolar daha yatırım çekmiştir.
Ürünler ve Teknolojiler
Deepgram, uçtan uca derin öğrenme mimarisiyle çalışan ses teknolojileri geliştirir. Şirketin temel ürün portföyü dört ana API üzerine kuruludur: konuşmadan metne (speech-to-text), metinden sese (text-to-speech), ses zekâsı (audio intelligence) ve sesli ajan API’si (voice agent API). Bu ürünler, kurumsal çağrı merkezlerinden tıbbi dökümlere, podcastten sanal asistanlara kadar geniş bir kullanım yelpazesine sahiptir.
Speech-to-text alanında kullanılan Nova-3 modeli, 30’dan fazla dili destekleyerek hızlı, doğru ve maliyet etkin transkripsiyon sağlamayı hedeflemektedir. Model, gürültülü ortamlarda ve çoklu konuşmacılı senaryolarda yüksek doğruluk oranına ulaşmak üzere geliştirilmiştir.
Text-to-speech tarafında ise Aura-2 adlı model, gerçek zamanlı konuşmalar için 200 milisaniyenin altında gecikme süresiyle çalışmakta ve profesyonel, doğal seslerle çok sayıda sektöre uygunluk sunmaktadır. Aura-2, sağlık, finans, hukuk gibi alanlara özgü terimleri doğru telaffuz edebilmek amacıyla alan-tabanlı ses sentezleme teknolojisiyle geliştirilmiştir.
Aura 2 (Deepgram)
Audio Intelligence bileşeni, özetleme, konu tespiti, niyet tanıma ve duygu analizi gibi işlevleri yerine getirerek sesli veriden daha fazla anlam çıkarılmasına olanak tanır. Bu özellikler, çağrı merkezi analitiği, müşteri deneyimi yönetimi ve içerik denetimi gibi alanlarda kullanılmaktadır.
Voice Agent API ise sesli ajanların insan benzeri tepki süreleri ve doğal konuşma akışıyla etkileşim kurabilmesini sağlayan, birleşik bir konuşmadan-konuşmaya (speech-to-speech) platformdur. Bu yapı, büyük dil modelleriyle entegre çalışarak yapay zekâ tabanlı sesli asistanların gerçek zamanlı karar verebilmesini ve konuşma içinde kesintilere uyum sağlayabilmesini sağlar.
Kullanım Alanları
Deepgram teknolojileri, özellikle müşteri hizmetleri, çağrı merkezi yönetimi, medya ve sağlık sektörlerinde yaygın olarak kullanılmaktadır. Şirketin çözümleri; Amazon Web Services (AWS), Twilio, Vonage, AudioCodes, Daily, Cognigy ve Vercel gibi çeşitli teknoloji sağlayıcılarıyla entegre edilebilmektedir.
Tıbbi alanda kullanılan Nova-3 Medical modeli, sağlık terminolojisine duyarlı olarak geliştirilen özel bir konuşmadan metne çözüm sunmakta, HIPAA uyumluluğu çerçevesinde hasta bilgilerinin gizliliğini sağlamaktadır.
Podcast ve video içerik üreticileri için sağlanan ses transkripsiyon hizmetleri, altyazı üretimi, içerik özetleme ve duygu analizi gibi işlevler yoluyla erişilebilirlik ve arama motoru optimizasyonuna katkıda bulunmaktadır.
Kurumsal Yapı ve Konum
Deepgram, merkezi San Francisco, Kaliforniya’da olmak üzere ABD’de birçok eyalette ve dünya genelinde beşten fazla ülkede uzaktan çalışan bir yapı içinde faaliyet göstermektedir. Şirketin üst yönetim kadrosunda Scott Stephenson (CEO), Adam Sypniewski (CTO), Shadi Baqleh (COO), Anoop Dawar (CSO), Praveen Rangnath (CMO) ve Natalie Rutgers (Ürün Direktörü) gibi isimler yer almaktadır.
Fiyatlandırma Politikası
Deepgram, esnek kullanım senaryolarını desteklemek amacıyla üç ana fiyatlandırma planı sunmaktadır: kullandıkça öde modeli, yıllık ön ödemeli büyüme planı ve kurumsal abonelik. Tüm planlar, konuşmadan metne (speech-to-text), metinden sese (text-to-speech), ses zekâsı (audio intelligence) ve sesli ajan API'lerine erişim imkânı sağlamaktadır.
Kullandıkça Öde (Pay As You Go) modeli, başlangıçta ücretsiz krediyle sunulan, kredi kartı gerektirmeyen ve belirli eşzamanlılık limitleriyle yapılandırılmış bir seçenektir. Küçük ölçekli projeler, test süreçleri ve yeni kullanıcılar için uygundur.
Büyüme Planı (Growth Plan), yıllık ön ödemeli kredi alımına dayalı bir modeldir. Bu planda kullanıcılar, yıllık taahhütleri karşılığında kullanım hacmine göre indirimli fiyatlardan yararlanabilir. Bu plan, ölçeklenebilir uygulama geliştiren orta ölçekli işletmelere yöneliktir.
Kurumsal Plan (Enterprise Plan) ise yüksek hacimli veri işleme, özel model eğitimi, özel dağıtım seçenekleri, özel destek hizmetleri ve gelişmiş güvenlik ihtiyaçları olan kuruluşlara hitap eder. Kurumsal düzeyde özelleştirme ve entegrasyon olanakları içerir.
Deepgram’in fiyatlandırma politikası, kullanılan özellikler (örneğin akıllı biçimlendirme, konuşmacı ayrımı, duygu analizi gibi), veri işleme süresi ve karakter sayısına göre şekillendirilir. Gelişmiş özellikler, ek modül olarak plana dahil edilebilir. Tüm planlar, topluluk desteğine ve geliştirici belgelerine erişim sunar. Ayrıca yüksek hacimli kullanım durumları için hacme bağlı indirimler sağlanmaktadır.
Gelecek Vizyonu
Deepgram, sesin yapay zekâ çağında temel bir veri kaynağı olduğuna inanmakta ve bu nedenle “insan dili şirketi” olma vizyonuyla hareket etmektedir. Şirketin stratejik öncelikleri arasında, gerçek zamanlı sesli yapay zekâ uygulamaları için kapsamlı model mimarisi geliştirmek, küresel dil desteğini genişletmek ve doğal dil işleme alanındaki araştırmaları sürdürmek yer almaktadır. Deepgram, özellikle alan odaklı, gerçek zamanlı, ölçeklenebilir ve düşük maliyetli ses çözümleriyle kurumsal pazarda büyümeyi hedeflemektedir.


