OpenAI, ChatGPT’ye ağız ve gözler veriyor

celeron

Global Mod
Global Mod


  1. OpenAI, ChatGPT’ye ağız ve gözler veriyor

ChatGPT artık konuşabiliyor. OpenAI Pazartesi günü, konuşmalar yapabilen ve görüntüleri kullanarak etkileşime girebilen yapay zeka sohbet robotuna yönelik bir güncelleme yayınladı. Amazon’un Alexa’sında, Apple’ın Siri’sinde ve diğer dijital sesli asistanlarda olduğu gibi, kullanıcılar ChatGPT ile konuşabiliyor ve bot onlara cevap veriyor.

Reklamcılık



OpenAI, Pazartesi günü yeni özellikleri tanıtan bir blog yazısında, ses özelliğinin “birçok yaratıcı ve erişilebilirlik odaklı uygulamanın kapılarını açtığını” yazdı.

ChatGPT’den Uyku Zamanı Hikayeleri


OpenAI, ChatGPT’nin yeni ses fonksiyonuyla, hareket halindeyken de konuşmalar yapılabileceğini, “aileniz için bir uyku vakti hikayesi isteyebileceğinizi veya yemek masasında bir tartışmaya aracılık edebileceğinizi” söylüyor ve bazı uygulama örneklerine isim veriyor.

OpenAI, ChatGPT’nin sentetik seslerinin popüler dijital ses asistanlarında kullanılan diğer seslerden daha doğal olduğunu savunuyor. Erkek ve kadın sesleri dahil olmak üzere seçim yapabileceğiniz beş farklı seçenek vardır. Yeni konuşma işlevi, metinden ve birkaç saniyelik konuşma örneklerinden insan benzeri bir ses üretebilen yeni bir metinden konuşmaya modeline dayanıyor. OpenAI, sesleri oluşturmak için profesyonel seslendirme sanatçılarıyla çalıştığını söylüyor.

OpenAI’ye göre arkasındaki teknoloji, Spotify tarafından Sesli Çeviri özelliğini pilot olarak kullanmak için de kullanılıyor, böylece platformun podcast yayıncıları içeriklerini kendi seslerini kullanarak farklı dillere çevirebiliyor.

Buzdolabının içindekilerin fotoğraflarıyla yemek pişirme


ABD’nin günlük gazetesi New York Times’a göre, diğer dijital asistanlar gibi ChatGPT’nin de eşsesli isimlerle ilgili sorunları var. Gazete yeni ChatGPT’ye “spor salonu”nun nasıl yazıldığını sordu; cevap şuydu: “JIM”. Ancak gazete, ChatGPT gibi bir chatbotun avantajlarından birinin kendi kendini düzeltebilmesi olduğunu söyledi. “Hayır, başka tür bir spor salonu” nidasına bot cevap verdi: “Ah, şimdi ne demek istediğini anlıyorum. İnsanların antrenman yaptığı yer GYM olarak yazılır.”

Gelecekte, ChatGPT kullanıcıları yalnızca sohbet robotuyla konuşmakla kalmayacak, aynı zamanda örneğin çevrelerindeki şeylerin fotoğraflarını çekebilecek ve sohbet robotundan örneğin ızgaranın neden başlamadığını gidermesini isteyebilecek. ChatGPT, bir fotoğraf, tablo veya grafik verildiğinde görüntünün ayrıntılı bir açıklamasını sağlayabilir ve içeriğiyle ilgili soruları yanıtlayabilir. Veya örneğin kullanıcılar buzdolabının içinin bir fotoğrafını yükleyebilir ve chatbot, ellerindeki malzemelerle hazırlayabilecekleri yemeklerin bir listesini önerebilir.

ChatGPT, chatbot ve sesli asistanı birleştiriyor


Microsoft’un bağlı kuruluşu OpenAI’nin ChatGPT’nin başarısı, yapay zeka konusunda bir heyecana yol açtı. Hızla gelişen yapay zeka teknolojisi, çok büyük miktarda veriyi işleyip sentezleyerek belgeleri özetleyebilir, bilgisayar kodları yazabilir, anlaşılır konuşmalar ve hatta fotoğraflar ve videolar üretebilir. Giderek daha fazla şirket yapay zeka kullanımına güveniyor ve kendi üretken yapay zeka tabanlı uygulamalarını pazara sunmaya çalışıyor.

ChatGPT’nin yeni sürümüyle OpenAI, Google Bard gibi rakip sohbet robotlarının ötesine geçerken aynı zamanda Alexa ve Siri gibi teknolojilerle de rekabet ediyor. Amazon ve Apple’ın sesli asistanları uzun süredir akıllı telefonlar, dizüstü bilgisayarlar ve diğer cihazlarla sözlü olarak etkileşim kurmanın yollarını sunuyor. Ancak ChatGPT ve Google Bard gibi sohbet robotları daha güçlü ses yeteneklerine sahip ve anında e-posta, şiir veya dönem ödevi yazabiliyor ve kendilerine sunulan neredeyse her konuda kendilerini ifade edebiliyor. OpenAI, ChatGPT güncellemesiyle artık iki iletişim yöntemini bir bakıma birleştirmiş oldu.

OpenAI’ye göre ChatGPT’deki yeni ses ve görüntü işlevleri önümüzdeki iki hafta içinde Plus ve Enterprise tarife aboneleri için aktif hale gelecek. Diğer kullanıcı grupları takip etmelidir. Ancak ses işlevi başlangıçta yalnızca iOS’ta, yani iPhone’larda, iPad’lerde ve sesli Android cihazlarda kullanılabilecek; Öte yandan görüntü işlevi tüm platformlarda mevcuttur.


(akın)



Haberin Sonu