Speak

Kaydet

Paylaş

Alıntıla

Speak

Kuruluş Tarihi				2016
Kurucu				Connor Zwick Andrew Hsu
Konum				San Francisco ABD California
Web Sitesi				https://www.speak.com/

Speak, yapay zekâ (YZ) destekli bir dil öğrenme platformudur. Kullanıcılara konuşma pratiği yapma imkânı sunarak konuşma akıcılığına odaklanan bu uygulama, özellikle İngilizce ve İspanyolca dillerinde eğitim sunmaktadır. 2016 yılında Connor Zwick ve Andrew Hsu tarafından San Francisco merkezli olarak kurulan şirket, mobil uygulama formatında hizmet vermektedir. Şirketin ofisleri San Francisco, Seul, Tokyo, Taipei ve Ljubljana’da yer almaktadır.
Gelişim Süreci
Speak, ilk olarak 2019 yılında Güney Kore pazarında kullanıcılarla buluşmuştur. Kısa sürede ülkede en çok kullanılan İngilizce dil öğrenme uygulaması hâline gelmiştir. Platformun kullanıcı tabanı 40’tan fazla ülkeye yayılmış ve 10 milyondan fazla kullanıcıya ulaşmıştır. 2024 yılı itibarıyla Speak, Accel liderliğinde gerçekleştirilen Seri C (C Serisi) yatırım turunda 78 milyon Amerikan doları yatırım almış, toplam yatırım miktarını 162 milyon dolara çıkarmış ve şirketin piyasa değeri 1 milyar dolara ulaşmıştır. Önceki yatırım turlarında OpenAI Startup Fund, Khosla Ventures, Y Combinator, Founders Fund ve Buckley Ventures gibi kurumlar ile Sam Altman, Peter Thiel ve Jeff Weiner gibi bireysel yatırımcılar yer almıştır.
Teknolojik Altyapı
Speak, dil öğrenimini konuşma temelli bir yöntemle yapılandırmaktadır. Uygulama, kullanıcıların yüksek sesle konuşmalarını teşvik eden dersler ve konuşma egzersizleri sunar. Bu yaklaşım, geleneksel dil öğrenme araçlarında eksik kalan konuşma pratiği ihtiyacını karşılamayı hedeflemektedir.

Platformun temel teknolojisi, streaming ASR (akış tabanlı otomatik konuşma tanıma) sistemine dayanmaktadır. Speak, farklı aksanlara sahip başlangıç seviyesindeki kullanıcıların konuşmalarını tanıyabilen bir konuşma tanıma modeli geliştirmiştir. Bu model, şirketin kendi kullanıcı verisiyle eğitilerek iyileştirilmiş ve %60 oranında kelime hata oranı (WER, Word Error Rate) azaltımı sağlamıştır. Model, Nvidia’nın NeMo framework'ü (açık kaynaklı YZ ve konuşma modeli geliştirme kütüphanesi) kullanılarak eğitilmiştir.

Kullanıcılara gerçek zamanlı geri bildirim sunabilmek amacıyla Riva ve Triton Inference Server altyapıları Google Cloud Platform üzerinde Kubernetes mimarisiyle entegre edilmiştir. Konuşma sırasında veri aktarımı WebSocket ve gRPC (Gelişmiş Uzaktan Prosedür Çağrısı - Google Remote Procedure Call) protokolleri aracılığıyla sağlanmaktadır.
API Entegrasyonu
2024 yılında Speak, OpenAI tarafından sunulan GPT-4o modelinin Realtime API (Gerçek Zamanlı Uygulama Programlama Arayüzü) desteğini kullanarak “Live Roleplays” adlı özelliği tanıtmıştır. Bu özellikle birlikte kullanıcılar, gerçek zamanlı ve doğrudan ses girdisi/çıktısı ile çalışan senaryolarda YZ ile konuşma pratiği yapabilmektedir. Sistem, yalnızca kelime düzeyinde değil, aynı zamanda tonlama, telaffuz ve prosodi (konuşma ritmi ve melodisi) açısından da değerlendirme yaparak kullanıcıya geri bildirim sunmaktadır.
Öğrenme Felsefesi
Speak’in öğrenme modeli üç temel adıma dayanmaktadır. İlk olarak kullanıcı, hedef dilde yoğun konuşma ve dinleme pratiğine yönlendirilir. Ardından bu kalıpların çeşitli varyasyonlarla tekrar edilmesi sağlanır. Son olarak ise öğrenilen kalıplar gerçek dünya bağlamında YZ destekli senaryolarla pekiştirilir. Bu süreçte kullanıcıya özel ders planları, geri bildirim mekanizmaları ve hedef odaklı yönlendirmeler sunulur.

Ayrıca platform, kullanıcıların gelişimini takip etmek için “yeterlik grafiği” (proficiency graph) sistemini kullanır. Bu sistem, kullanıcının dil seviyesine göre uygun cümle kalıpları ve kelime dağarcığı sunarak kişiselleştirilmiş bir deneyim sağlar.
Kurumsal Uygulamalar
Speak, bireysel kullanıcıların yanı sıra kurumsal müşterilere yönelik “Speak for Business” hizmeti de sunmaktadır. Bu hizmet kapsamında kurumlar çalışanlarının İngilizce yeterliliklerini artırmayı hedefleyen özelleştirilmiş ders içerikleri ve raporlama araçlarına erişmektedir. Speak for Business programı, 200'den fazla kurumsal müşteri ve %85 kullanıcı benimseme oranıyla büyümektedir.

Uygulama, özellikle Güney Kore, Japonya ve Tayvan gibi pazarlarda hızla yayılmış; Mandarin konuşulan pazarlara ve İspanyolca dil desteğine geçiş yaparak Kuzey Amerika ve Avrupa'da da genişlemeye başlamıştır. Speak’in kullanıcı kitlesi her yıl iki katına çıkmakta, bu büyüme şirketin yatırımcı ilgisini korumasını sağlamaktadır.
Gelecek Perspektifi
Speak, konuşma odaklı öğrenme sistemini daha fazla dilde kullanıma açmayı ve kişiselleştirme düzeyini artırmayı hedeflemektedir. Şirket, halihazırda İngilizce ve İspanyolca desteklemekte olup Fransızca gibi yeni dilleri eklemek üzere çalışmalar yürütmektedir. Ayrıca telaffuz değerlendirmesi, fonem (ses birimi) temelli geri bildirim, daha hassas akıcılık puanlama sistemleri ve konuşmadan konuşmaya modeller (speech-to-speech models) gibi yeni özelliklerin ürünleştirilmesi planlanmaktadır.

Platformun kurucularından Connor Zwick’e göre, Speak’in uzun vadeli hedefi, en gelişmiş YZ temelli dil öğretmenini geliştirerek, dünya çapında milyonlarca kişinin kendi anadilinden farklı dillerde özgüvenle konuşabilmesini sağlamaktır. Bu doğrultuda, kişiye özel öğrenim planları, etkileşimli içerikler ve sürekli geliştirilen teknik altyapı ile platformun küresel dil öğreniminde etkili bir rol oynamaya devam etmesi beklenmektedir.

Kaynakça

"About Us." Speak. Erişim Tarihi: 13 Mayıs 2025. https://www.speak.com/.
"B2B Solutions." Speak. Erişim Tarihi: 13 Mayıs 2025. https://www.speak.com/b2b.
"Careers." Speak. Erişim Tarihi: 13 Mayıs 2025. https://www.speak.com/careers.
"Career Posting: Speak Job Listing." AshbyHQ. Erişim Tarihi: 13 Mayıs 2025. https://jobs.ashbyhq.com/speak/e91eb4bc-93bf-4e3a-b7c9-4a2f506df43f.
"Company Posts." LinkedIn. Erişim Tarihi: 13 Mayıs 2025. https://www.linkedin.com/company/usespeak/posts/?feedView=all.
"Forbes Company Profile: Speak." Forbes. Erişim Tarihi: 13 Mayıs 2025. https://www.forbes.com/companies/speak/?list=ai50.
"Language Learning App Speak Nets $20M, Doubles Valuation." TechCrunch. Erişim Tarihi: 13 Mayıs 2025. https://techcrunch.com/2024/06/20/language-learning-app-speak-nets-20m-doubles-valuation/.
"OpenAI: Speak and Connor Zwick." OpenAI. Erişim Tarihi: 13 Mayıs 2025. https://openai.com/index/speak-connor-zwick/.
"Speak Makes Forbes 2025 AI 50 List." Korea Times. Erişim Tarihi: 13 Mayıs 2025. https://www.koreatimes.co.kr/business/tech-science/20250419/ai-based-english-learning-app-speak-makes-forbes-2025-ai-50-list.
"Speak Raises $78M at $1B Valuation to Help Users Learn Languages by Talking Out Loud." TechCrunch. Erişim Tarihi: 13 Mayıs 2025. https://techcrunch.com/2024/12/10/openai-backed-speak-raises-78m-at-1b-valuation-to-help-users-learn-languages-by-talking-out-loud/.
"Yapay Zeka Destekli Dil Öğrenimini Dönüştüren Speak." Unite.AI Türkiye. Erişim Tarihi: 13 Mayıs 2025. https://www.unite.ai/tr/speak%2C-yapay-zeka-destekli-dil-%C3%B6%C4%9Frenimini-d%C3%B6n%C3%BC%C5%9Ft%C3%BCrmek-i%C3%A7in-78-milyar-de%C4%9Ferlemeyle-1-milyonluk-C-serisi-finansman%C4%B1-sa%C4%9Flad%C4%B1/.

Sen de Değerlendir!

0 Değerlendirme

Yazar Bilgileri

YazarÖmer Said Aydın13 Mayıs 2025 15:15

Etiketler

#Gpt4o #YazilimMimari #KonusmaTerapisi #YabanciDilEgitimi #MobilTeknoloji #ASR #Konuşma Akıcılığı #Dil Öğrenme #yapay zeka #kişiselgelişim #Teknolojik Altyapı #EğitimdeTeknoloji #Geri Bildirim #yapayzeka

Speak

Kuruluş Tarihi				2016
Kurucu				Connor Zwick Andrew Hsu
Konum				San Francisco ABD California
Web Sitesi				https://www.speak.com/

Tartışmalar

Henüz Tartışma Girilmemiştir

"Speak" maddesi için tartışma başlatın

Tartışmaları Görüntüle

İçindekiler

Gelişim Süreci
Teknolojik Altyapı
API Entegrasyonu
Öğrenme Felsefesi
Kurumsal Uygulamalar
Gelecek Perspektifi

Bu madde yapay zeka desteği ile üretilmiştir.