Google, Yapay Zeka Görsellerinde Şeffaflık Sağlamak İçin SynthID’yi Duyurdu

Google’dan Yapay Zeka Görsellerinde Şeffaflık Adımı: SynthID

Google, yapay zeka ile üretilen görsellerde şeffaflık sağlamak için önemli bir adım atarak SynthID adlı yeni bir teknolojiyi duyurdu. Bu, yapay zeka tarafından oluşturulan sanat eserlerine yönelik bir filigran ve tanımlama aracı olarak işlev görüyor. Google DeepMind, SynthID’nin insan gözüyle tespit edilemeyen dijital bir filigranı doğrudan görüntünün piksellerine yerleştirdiğini belirtiyor.

SynthID, Google’ın bulut tabanlı yapay zeka araçları arasında yer alan Imagen programını kullanarak başlangıçta “sınırlı sayıda” müşteriye sunulmakta. Üretken yapay zeka sanatı ile ilgili birçok tartışmalı konu bulunsa da, deepfake oluşturma potansiyeli bu sorunların en başında geliyor. Örneğin, sosyal medyada hızla yayılan ve Papa’nın giydiği yapay zeka ile üretilmiş hip-hop kıyafeti, gelişen üretken araçların ne tür manipülasyonlara yol açabileceğinin çarpıcı bir örneği olarak karşımıza çıkıyor.

Yapay zeka tarafından üretilen sanatsal içeriklerin siyasi reklamlar gibi önemli uygulamalarda kullanılmasının, sosyal medyada dolaşan sıradan bir görselden çok daha büyük zararlara yol açabileceği aşikâr. Bu bağlamda, içeriklerin yapay zeka tarafından oluşturulduğunu açıkça belirtmek amacıyla görsel ve işitsel içeriğe filigran eklemek, Temmuz ayında yedi yapay zeka şirketinin Beyaz Saray’da gerçekleştirilen bir toplantı sonrasında üzerinde anlaştığı gönüllü taahhütlerden biriydi. Google, böyle bir sistemi hayata geçiren ilk şirket olma unvanını taşıyor.

Google, SynthID’nin teknik detayları hakkında çok fazla bilgi paylaşmıyor; ancak filigranın basit düzenleme teknikleriyle kolayca kaldırılmayacağını vurguluyor. Şirket, DeepMind blogunda “Görüntü manipülasyonlarında algılanamazlık ve sağlamlık arasında doğru dengeyi bulmak zordur” ifadesine yer veriyor.

DeepMind’ın SynthID proje liderleri Sven Gowal ve Pushmeet Kohli, “SynthID’yi görüntü kalitesinden ödün vermeden tasarladık; ayrıca filtre ekleme, renkleri değiştirme ve JPEG gibi sıkıştırma yöntemleri kullanılarak kaydedildiğinde bile filigranın algılanabilir kalmasını sağlamak için gerekli önlemleri aldık” şeklinde açıklamada bulunuyor. SynthID, görüntüyü üç farklı dijital filigran güven düzeyine göre sınıflandırıyor: Algılanan, algılanmayan ve muhtemelen algılanan.

Sistem, görüntünün piksellerine gömülü olduğu için Google, SynthID’nin Adobe’nin şu anda açık beta sürecinde olan Photoshop üretken özellikleri ile birlikte çalışabileceğini ifade ediyor. SynthID, hem filigranlama hem de tanımlama amacıyla geliştirilen iki ayrı derin öğrenme modeli içeriyor. Google, bu iki modelin farklı görseller üzerinde eğitim aldığını ve bu süreçte birleşik bir makine öğrenimi modeli oluşturduklarını belirtiyor.

Gowal ve Kohli, “Birleşik model, filigranlı içeriğin doğru bir şekilde tanımlanması ve filigranı orijinal içerikle görsel olarak hizalayarak algılanamazlığın arttırılması gibi bir dizi hedefle optimize edildi” diyor. Google, bu sistemin mükemmel bir çözüm olmadığını kabul ederken, “aşırı görüntü manipülasyonlarına karşı kusursuz olmadığını” da ekliyor. Ancak, filigranı “insanların ve kuruluşların yapay zeka tarafından oluşturulan içeriklerle sorumlu bir şekilde etkileşime girmesine olanak tanıyan umut verici bir teknik yaklaşım” olarak tanımlıyor. Şirket, bu aracın metin, video ve ses üreten diğer yapay zeka modellerine de genişletilebileceğini ifade ediyor.