Spiral şekilli şehirler: Image AI alışılmadık temsiliyle etkileyicidir

celeron

Global Mod
Global Mod
Geçtiğimiz Pazar (10 Eylül), Reddit kullanıcısı “Ugleh”, şaşırtıcı geometrik özellikleri nedeniyle sosyal medyada büyük ilgi gören spiral şekilli bir ortaçağ köyünün yapay zeka tarafından oluşturulmuş bir görüntüsünü yayınladı. Kullanıcının sonraki gönderileri, 145.000’den fazla beğeni alan bir tweet de dahil olmak üzere daha da fazla övgü aldı. Ugleh, görüntüleri kararlı difüzyon ve ControlNet adı verilen bir kontrol tekniği kullanarak oluşturdu.

Reklamcılık



İnternetteki görsele verilen tepkiler şaşkınlıktan, üretken yapay zeka sanatında yeni bir şeyin gelişiminin tanınmasına kadar uzanıyordu. Bir X kullanıcısı (eski adıyla Twitter) “Daha önce hiç böyle resimler görmemiştim. Sanat dünyasında yeni bir şey” diye yazdı. Yapay zeka sanatçısı Kali Yuga, “Çok sayıda yapay zeka sanatı gördüm, uzun zamandır bu alandayım ve bu şimdiye kadar gördüğüm en harika parçalardan biri. Bunu çok iyi başardınız” diye yazdı. X

Kuluçka merkezi Y-Combinator’ın kurucu ortağı ve sosyal medyadaki teknoloji konularına sık sık yorum yapan Paul Graham şunları yazdı: “İşte o zaman yapay zeka tarafından üretilen sanat benim için Turing Testini geçti.” Graham, Turing Testi’nden (sözde bir makinenin davranışının bir insanın davranışından ayırt edilemez olup olmadığını test eden test) kelimenin tam anlamıyla değil, bir metafor olarak bahsetmiş olsa da, açıkça etkilenmişti.


Satranç tahtası şeklindeki bir ortaçağ köyünün yapay zeka tarafından oluşturulmuş görüntüsü.
(Resim: Ugleh / Kararlı Difüzyon)

Elbette herkes etkilenmedi ve bazıları “Gölgelerin çoğu yanlış ve pencerelerin hemen üzerindeki bacalar mantıklı değil. Yakınlaştırdığınızda, yapay zekadan gelen gürültünün açıklayıcı modelini de görebilirsiniz.” sanat.”

Haziran ayında, animelerden ilham alan sanat eserleri de dahil olmak üzere gerçek sanat eserlerine benzeyen QR kodları oluşturmak için ControlNet ile birlikte AI görüntü sentezi modeli Stable Diffusion’ı kullanan bir teknik hakkında bir rapor vardı. Ugleh, bu QR kodlarını (kendileri de geometrik şekiller olan) oluşturmak için optimize edilmiş aynı sinir ağını kullandı ve bunun yerine onu spiraller ve dama tahtası desenlerinin basit görüntüleriyle besledi.

“Mesafede kalabalık caddeler ve kalenin bulunduğu Orta Çağ köy sahnesi (başyapıt:1.4), (en iyi kalite) (ayrıntılı)” isteminde ControlNet, görüntülerin sanatsal öğelerinin algılanan spiral ve dama tahtası şekillerine karşılık geldiği sahneleri oluşturdu. Fotoğraflardan birinde bulutlar tepede yay çiziyor ve insanlar sarmal yola karşılık gelen hafif bir eğri şeklinde duruyor. Başka bir görüntüde bulutlardan oluşan kareler, çitler, bina yüzleri ve bir vagon takımı dama tahtası benzeri bir sahne oluşturuyor.

ControlNet’in büyüsü


Bu nasıl çalışır? Kararlı difüzyon hakkında sıklıkla rapor verdik. İnternetten alınan milyonlarca görüntü üzerinde eğitilmiş bir sinir ağı modelidir. Bunun anahtarı, ilk olarak Lvmin Zhang, Anyi Rao ve Maneesh Agrawala tarafından yazılan “Metinden Görüntüye Yayılma Modellerine Koşullu Kontrol Ekleme” başlıklı bir araştırma makalesinde açıklanan ControlNet’tir. Şubat 2023’te piyasaya sürüldü ve Stabil Difüzyon topluluğunda hızla popüler hale geldi. .

Tipik olarak bir Kararlı Dağıtım görüntüsü, bir metin istemi (text2image olarak adlandırılır) veya bir görüntü istemi (img2img) kullanılarak oluşturulur. ControlNet, duruş tespiti, derinlik haritalaması, normal haritalama, kenar tespiti ve çok daha fazlasını içeren bir kaynak görüntüden çıkarılan bilgiler biçiminde ek yardım sağlar. ControlNet ile bir AI grafik sanatçısı, görüntüdeki bir nesnenin şeklini veya pozunu çok daha doğru bir şekilde yeniden oluşturabilir.



Bazı görüntüleri oluşturmak için kullanılan Ugleh’in ControlNet işleminin ekran görüntüsü.
(Resim: Ugleh)

ControlNet ve benzeri yönlendirmelerle, Ugleh’nin çalışmalarını kopyalamak kolaydır ve diğerleri bunu dama tahtası benzeri anime karakterleri, bir animasyon, şok edici bir görüntü olarak bir ortaçağ köyü (işte izlemek için şaşırtıcı derecede uygun) ve bir ortaçağ köyü dahil olmak üzere eğlenceli şekillerde yapmıştır. Jan Vermeer’in “İnci Küpeli Kız” tablosunun ortaçağ köyü versiyonu.

Büyük ilgiye ve sanat eserlerini NFT’lere dönüştürmeye yönelik birçok teklife rağmen Ugleh şimdilik geri duruyor. Yeni ControlNet teknolojisini kimin denediği hakkında.”

ControlNet ile denemeler yapmak istiyorsanız burada iyi talimatlar bulacaksınız. Ugleh ayrıca Imgur’da spiral ve dama tahtası şablon dosyaları da dahil olmak üzere adım adım talimatlar yayınladı.

Sanat eseri dikkat çekici olsa da mevcut ABD telif hakkı politikası, görsellerin telif hakkı korumasına uygun olmadığını, dolayısıyla kamu malı olabileceğini öne sürüyor. Yapay zeka tarafından üretilen sanat eserleri birçokları için etik ve yasal açıdan hâlâ tartışmalı bir konu olsa da, yaratıcı meraklılar bu yeni araçlarla vasıfsız veya eğitimsiz bir uygulayıcı için mümkün olanın sınırlarını zorlamaya devam ediyor. Bu tür işleri mümkün kılan gerekli insani ilham kıvılcımının yasanın tanıyıp tanımayacağı veya nasıl tanıyacağı hâlâ belirsiz.

Bu makale ilk olarak Ars Technica’da yayınlanmıştır.


(tiw)



Haberin Sonu