OpenAI’den akılalmaz yapay zeka GPT-4o: Ses ve görüntü anlıyor

Yayın tarihi: 14 Mayıs 2024 Salı 6:46 am - Güncelleme: 14 Mayıs 2024 Salı 6:54 am

Yapay zeka sohbet robotu ChatGPT’nin geliştiricisi OpenAI, kullanımı daha kolay ve sezgisel olacak olan ”GPT-4o”yu tanıttı.

OpenAI’dan yapılan açıklamada, GPT-4o’nun daha doğal insan-bilgisayar etkileşimine doğru atılmış bir adım olduğu belirtilerek, modelin herhangi bir metin, ses ve görüntü kombinasyonundan oluşan girdilerden çıktı ürettiği aktarıldı.

GÖRÜNTÜ VE SES ANLAMA KONUSUNDA DAHA YETENEKLİ

Modelin ses girişlerine verdiği yanıt süresinin, herhangi bir konuşmadaki insan tepki süresine benzer olduğuna işaret edilen açıklamada, GPT-4o’nun, mevcut modellerle karşılaştırıldığında özellikle görüntü ve ses anlama konusunda daha iyi olduğu vurgulandı.

TÜM GİRDİ VE ÇIKTILAR AYNI SİNİR AĞI TARAFINDAN İŞLENİYOR

GPT-4o ile metin, görüntü ve ses genelinde uçtan uca tek bir yeni modelin eğitildiğinin bilgisi verilerek, yeni modelin, tüm girdi ve çıktıların aynı sinir ağı tarafından işlendiği ilk model olduğu ifade edildi. Ayrıca hem ücretsiz hem de ücretli kullanıcılar için, bilgisayarda yapılan işlemlere entegre olacak şekilde tasarlanmış, Mac işletim sistemi için yeni bir ChatGPT masaüstü uygulamasının da kullanıma sunulduğu bildirildi.

ÜCRETSİZ OLARAK DA SUNULACAK

Öte yandan OpenAI’nın bugün düzenlediği tanıtım etkinliğinde, modelin önceki modellere göre daha uygun maliyetli olması nedeniyle ücretsiz olarak da sunulacağı, ücretli GPT-4o kullanıcılarının ise daha fazla kapasiteye sahip olacağı kaydedildi. Yeni modelin birkaç hafta içinde ChatGPT’de sunulacağı belirtildi.

Kaynak: TELE1