Büyük Dil Modelleri: New York Times içeriğiyle eğitim yok

celeron · 15 Ağu 2023

New York Times, içeriğinin AI modellerini eğitmek için kullanılmasını engellemek istiyor, Adweek raporları. Buna göre, ABD dergisi 3 Ağustos’ta hizmet şartlarını güncelledi. Sonuç olarak, içeriklerini Büyük Dil Modelleri (LLM) eğitimi için kullanmak artık mümkün değildir. İçerik, metin, fotoğraflar, resimler, ses ve video klipler, meta veriler ve daha fazlasını içerir.

Reklamcılık

Kullanım koşullarına göre, yazılı izin verilmedikçe web’de gezinme ve veri setlerinin daha sonra yayınlanması veya sağlanması da yasaktır. New York Times’a göre, kuralları ihlal etmek belirsiz cezalarla sonuçlanabilir.

robots.txt dosyasında değişiklik yok

The Verge’e göre, yeni kuralların getirilmesine rağmen, New York Times, arama motoru tarayıcılarına hangi URL’lerin erişilebilir olduğunu bildiren robots.txt dosyasında herhangi bir değişiklik yapmamış gibi görünüyor. OpenAI kısa süre önce GPTBot’un web sitelerine erişmesini engellemenin bir yolunu tanıttı. Verge ayrıca GPTBot’u da engeller.

ChatGPT’nin web sitenizdeki verileri taramasını istemiyorsanız, web sitenizin robots.txt dosyasına iki satır ekleyebilirsiniz. Kar amacı gütmeyen kuruluş Common Crawl tarafından işletilen web tarayıcısı CCBot gibi diğer web tarayıcıları da bu şekilde engellenebilir. The Decoder’a göre, yaklaşık 3,15 milyar web sayfasından oluşan bir veri kümesine sahip ve AI eğitimi için OpenAI, Meta ve Google ile sözleşmeler müzakere etti. Ancak robots.txt dosyalarında yapılan değişikliklerin içerik paylaşımını tamamen engelleyip engellemeyeceği net değil.

(mak)

Haberin Sonu

Büyük Dil Modelleri: New York Times içeriğiyle eğitim yok

celeron

Global Mod