Bilimkurgu yazarı Ted Chiang, yakınlarda yazdığı bir yazıda Chatgpt’nin metin çıktılarını şöyle tarif ediyor: “internet ağındaki tüm metinlerden oluşturulmuş bulanık bir JPEG” veya semantik bir “düşük kaliteli görüntü”.[1] Fakat makine öğrenimine dayalı ağların oluşturduğu bulanık çıktıların tarihsel bir boyutu da var: istatistik. Makine öğrenimi araçlarının yarattığı görseller, gerçekten var olan nesnelerin görüntüsü değil, istatistik işlemelerdir. Bırakın hakikati, olgusallığı bile ifade etmezler, yalnızca olasılığı yansıtırlar. Fotoğrafik aydınlatmanın ani şoku, amansız bir bürokrasi tarafından programlanmış çan eğrilerine, kayıp fonksiyonlarına ve uzun anahtar kelimelere bırakmıştır yerini.
Birer veri görselleştirmesi olarak bu işlemelerin herhangi bir şekilde nesnelerine işaret etmesi gerekmez. Varlıkları, fotoğraftaki gibi ışıncıkların sensörle temasına veya sıvı çözeltisine bağlı değildir. Vasatın, ortanın etrafında biraraya gelirler: ortalama halüsinasyonlarıdır bunlar. Ortalamaya işaret ederek normu temsil ederler. Benzerliğin yerine olasılığı geçirirler. Çözünürlük bakımından “düşük kaliteli görüntü” [poor images] olabilirler ama biçim ve öz açısından “adi imgeler”dir [mean images].
Geleneksel bir fotoğraf kümesinin istatistik işlemeye dönüştürülmesine bir örnek: “Have I been trained?” adlı arama motoru –sanatçı ikilisi Mat Dryhurst ile Holly Herndon’ın geliştirdiği gayet faydalı bir araç– sayesinde, metni görüntüye dönüştüren en popüler derin öğrenme üreticilerinden biri olan Stable Diffusion’ı eğitmede kullanılan LAION-5B adlı devasa veri kümesinde gezinebiliyorsunuz. Aşağıdaki ilk görselde gördüğünüz bana ait fotoğraflar, bu eğitim verilerinin içinde karşınıza çıkıyor. Stable Diffusion bunlarla ne yapıyor? Modelden “bir hito steyerl resmi”ni işlemesini istediğinizde çıkan sonuç, ikinci görsel.
Peki, Stable Diffusion A’dan B’ye nasıl ulaştı? Çıkan sonucun, hiç de ahım şahım bir “öncesi-sonrası” örneği olmadığı muhakkak; kimseye kendi fotoğrafını bu işlemden geçirmesini tavsiye etmem. Sonuç bayağı ortalama, hatta küçültücü görünüyor ama mesele tam da bu. Soru şu: Neyin ortalaması? Kimin ortalaması? Hangi ortalama? Stable Diffusion, benim bu portremi, eğitim verileriyle yapay bir ilişkisi olan meçhul işlemlerle üretilmiş sabit bir yaş aralığına gelecek şekilde işliyor. Stable Diffusion’ın kodu bilindiği için burada suçu nasıl işlediği bilinmeyen bir “kara kutu” algoritmasına atmak mümkün değil. Buna daha ziyade “beyaz kutu” algoritması diyebiliriz, veya bir sosyal filtre. Toplumun, ortalama internet çöpünün süzgecinden geçirerek beni nasıl gördüğünü yaklaşık olarak gösteren bir imge bu. Bütün gereken, fotoğraflarımdaki gerçeklik parazitinin ortadan kaldırılması ve içlerindeki sosyal sinyalin çıkarılıp alınması; sonuç, bir “adi imge”, birbiriyle ilintilenen ortalamaların işlenmesi, veya: ortalamanın farklı tonları.
Adi imgeler tesadüfi halüsinasyonlar değildir. Bilakis, veri popülizminin tahmin edilebilir ürünleridir. Yaygın olanı, alt sınıf konumuyla, vasatlıkla ve nahoş davranışla uyumlu hale getiren gerçek tutumları görselleştirirler. Kaynakları ortadan kalktıktan uzun süre sonra bile ekranlarda ve retinalarda iz bırakarak görülmeye devam eden imgelerdir onlar. Adi imgeler, uykunun olmadığı sosyal rüyalardır, toplumun irrasyonel fonksiyonlarını işlemden geçirerek mantıki sonuçlarına götürürler. Toplumun, kaotik ve dev ölçekli veri kapma yöntemleriyle ele geçirilmiş kendine dair görüşlerinin belgesel ifadeleridirler. Çevreyi kirleten devasa donanım altyapılarına, haklarından mahrum bırakılmış vasıfsız işçilere yaslanır, siyasi çatışmayı özkaynak olarak kullanırlar.
Hito Steyerl’in New Left Review (Mart/Haziran 2023) dergisinde yayınlanan “Mean Images” başlıklı yazısının ilk kısmından çevrildi.
[1] Ted Chiang, “Chatgpt is a Blurry jpeg of the Web”, New Yorker, 9 Şubat 2023.