Rapor: ChatGPT bir milyon saatlik YouTube videosuyla eğitildi

celeron · 8 Nis 2024

OpenAI'nin “Whisper” adlı bir program kullanarak, YouTube'un ana şirketi Google veya Alphabet'e veya kliplerin yaratıcılarına haber vermeden, ChatGPT için eğitim verileri olarak kullanılmak üzere YouTube'dan yaklaşık bir milyon saatlik video hazırladığı söyleniyor. Bu, New York Times tarafından OpenAI, Google ve şirket ortamındaki çeşitli kaynaklara atıfta bulunularak bildirildi.

Reklamcılık

Buna göre OpenAI'nin 2021 yılı sonunda eğitim materyallerinin tükendiği söyleniyor. Biraz açık söylemek gerekirse: İnternet gitmişti. AI start-up'ı, İngilizce olarak halka açık tüm metinleri zaten eğitim verilerine aktarmıştı. Üretken yapay zekaya yönelik mevcut modeller, önceden işlenmiş eğitim materyali ne kadar büyük olursa, daha iyi sonuçlar verir.

Böylece Times'a göre OpenAI, Whisper aracını kullanarak YouTube videolarının sesini toplu olarak metne dönüştürmeye başladı. Video platformunun kendisi de otomatik olarak oluşturulan altyazılar sunuyor ve Adobe Premiere gibi diğer programlar da artık bu yazıya dönüştürmeyi yüksek kalitede yapabiliyor. İçeriğinin yapay zeka eğitimi için kullanıldığı iddiasıyla ilgili olarak şu anda OpenAI ile hukuki bir anlaşmazlık içinde olan gazetenin daha sonraki raporlarında, Google'ın bunu kesinlikle fark ettiği belirtiliyor.

Google müdahale etmedi

Ancak şirket, kendi yapay zeka modelini eğitmek için zaten YouTube'un ve Google Dokümanlar gibi diğer hizmetlerin içeriğini kullandığı için buna karşı herhangi bir işlem yapmadı. New York Times'a göre Google, video yaratıcılarının haklarını ihlal ediyor olabileceğinin farkındaydı. Şu anda, özellikle ABD'de, telif hakkıyla korunan materyallerin uygun lisans anlaşmaları olmadan yapay zeka eğitimi için kullanılmasına karşı bir dizi dava ve başka şikayetler var. Times'a göre, yalnızca Amerika Birleşik Devletleri Telif Hakkı Bürosu geçen yıl bireylerden, şirketlerden ve diğer kuruluşlardan bu konuda 10.000'den fazla şikayet aldı.

ayrıca oku

Daha fazla göster

daha az göster

Son yıllarda çok sayıda teknoloji şirketi, Google ve Facebook da dahil olmak üzere hizmetlerini kullanmadan önce kendi oluşturduğunuz yapay zeka eğitim materyallerini kullanmayı kabul etmenizi gerektirecek şekilde hizmet şartlarını değiştirdi. Buna karşılık şirketler, diğer şirketlerin verilere erişmesini ve bunları kendi hizmetleri için kullanmasını yasaklıyor. OpenAI'nin, YouTube kampanyası öncesindeki dahili tartışmalarda ABD'nin yasal “adil kullanım” yapısına başvurduğu söyleniyor.

Lisanslama hala istisnadır

AB'nin Yapay Zeka Yasası da dahil olmak üzere, yapay zekaya yönelik yasal sınırların artması nedeniyle, bazı şirketler artık açıkça veri kaynaklarıyla lisans anlaşmaları da yapıyor. Bunun bir örneği, halka arzından önce Google ile bir anlaşma yapan Reddit'tir. Reddit kullanıcılarının verileri, yılda 60 milyon ABD doları karşılığında Google'a sunulacak.

Eğitim materyali olarak bir milyon saatlik YouTube videosunun veya 114 yıldan fazla yayınlanma süresinin sayısı ilk bakışta yüksek görünse de, platformun hızla büyümeye devam etmesi nedeniyle bu durum perspektife oturtulmuştur. Google, 2019 yılında YouTube'a her dakika yaklaşık 500 saatlik videonun yüklendiğini belirtmişti. Bu muhtemelen şu ana kadar önemli ölçüde arttı. Bu eski rakamlara dayanarak, bu, 33 saatin biraz üzerinde bir sürede, bir milyon saatten fazla yeni veya yeni düzenlenmiş materyalin elde edildiği anlamına gelir. OpenAI muhtemelen genel içeriğin yalnızca çok küçük bir bölümünü işlemiştir. Henüz cevaplanmamış bir soru, seçim için hangi kriterlerin kullanıldığıdır.

(Asla)

Haberin Sonu

Rapor: ChatGPT bir milyon saatlik YouTube videosuyla eğitildi

celeron

Global Mod