YeniHaber Aktar yeni arayüzüyle okurların karşısında!Gündem
13°C
22 April 2025
Ekonomi

Amazon, insan konuşmasına yakın AI ses modeli Nova Sonic’i geliştirdi

  • Nisan 9, 2025
  • 3 min read
Amazon, insan konuşmasına yakın AI ses modeli Nova Sonic’i geliştirdi

HANDE BERKTAN

Amazon, doğal konuşmaları anlayıp süratle yazıya dökebilen ve insan konuşmasına yüksek kalitede benzeri konuşma yetenekleri gösteren ve OpenAI’nin GPT 4.0 modelinden yaklaşık yüzde 80 daha ucuz olduğunu belirttiği yeni yapay zekâ ses modeli Nova Sonic’i tanıttı.

Teknoloji devi, Nova Sonic’in performansının sürat, konuşma tanıma ve konuşma kalitesini ölçen kıyaslamalarda OpenAI ve Google’ın öncü ses modelleriyle rekabet ettiğini belirtiyor. Nova Sonic, ortalama cevap mühleti 1,09 saniye ile Amazon’un evvelki sesli yapay zekalarına nazaran çok daha süratli karşılık verebiliyor.

Nova Sonic , farklı aksanlardaki konuşmaları tanıma ve kalabalık ortamlarda birden fazla konuşmacıyı ayırt etme testlerini muvaffakiyetle tamamladı. Şirket, bu modelin kullanıcı komutu olmadan internetten bilgi arayabildiğini, data tabanlarını tarayabildiğini ve gerekli durumlarda harici uygulamaları kendi başına açabildiğini tabir etti.

“Amazon’un yeni yapay zeka ses modeli, insan konuşmasına yüksek kalitede benzeri konuşma yetenekleri gösteriyor”

Amazon Yapay Genel Zeka Kıdemli Lider Yardımcısı Rohit Prasad, Amazon’un ses takviyeli teknoloji aracılığıyla müşteri tecrübelerini güzelleştirme taahhüdünü vurguladı. Prasad “Nova Sonic, birden fazla fonksiyonu tek bir modelde birleştirerek, daha hakikat, doğal ve ilgi cazip müşteri etkileşimleri sağlıyor. Nova Sonic kapsamlı testlerden geçmiş ve yüksek kaliteli, beşere benzeri konuşma yetenekleri göstermiştir. Doğal diyalog sürece ve konuşma tanıma doğruluğunda güçlü performans sergilemiştir.” açıklamasını yaptı.

Nova Sonic, öteki AI ses modellerine kıyasla konuşma tanıma yanlışlarına daha az eğilimli, bu da modelin, mırıldansalar, yanlış konuşsalar yahut gürültülü bir ortamda olsalar bile bir kullanıcının niyetini anlamada nispeten uygun olduğu manasına gelir. Amazon, Multilingual LibriSpeech isimli lisanlar ve lehçeler ortasında konuşma tanımayı ölçen bir kıyaslamada Nova Sonic’in İngilizce, Fransızca, İtalyanca, Almanca ve İspanyolcada ortalama alındığında sadece yüzde 4,2’lik bir söz kusur oranına (WER) ulaştığını söylüyor. Bu, modeldeki her 100 sözden yaklaşık dördünün bu lisanlardaki insan transkripsiyonundan farklı olduğu manasına geliyor.

Amazon, sesin ötesine geçerek manzara ve fizikî dünyadan alınan dataları işleyebilen daha gelişmiş yapay zeka modelleri üzerinde çalışmalar yürüttüğünü de açıkladı.

About Author

Haber Aktar

Leave a Reply

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir