Microsoft’un VASA-1: Yeni Bir Dönemin Başlangıcı
Microsoft’un en son üretken yapay zeka ürünü olan VASA-1, teknolojinin sınırlarını zorlayarak muazzam bir başarıya imza attı. Bu yenilikçi sistem, tek bir görsel ile bir ses dosyasını birleştirme yeteneği kazandı. Sonuç olarak, görseldeki kişinin konuşuyormuş gibi görünmesini sağlayan bir video oluşturabiliyor. Bu videolarda, ses dosyasına uygun olarak yalnızca kişinin ağzı değil, aynı zamanda yüz ifadeleri ve kafa hareketleri de dahil olmak üzere tüm görsel dinamik şekilde bir konuşmacıya dönüşüyor.
Üretken yapay zekanın ses ve görsel alanındaki hızlı gelişimi düşünüldüğünde, bu noktaya ulaşmamız kaçınılmaz bir sonuç gibi gözüküyor. Örneğin, bu yılın ilerleyen dönemlerinde genel kullanıma sunulması planlanan OpenAI’nin Sora isimli projesi, yazıdan videoya dönüştürme yeteneklerini çeşitli gösterim etkinliklerinde sergiledi. Ayrıca, OpenAI’nin geliştirdiği başka bir yapay zeka teknolojisi, yalnızca birkaç saniye dinledikten sonra herhangi birinin sesini kopyalayabilme yeteneğine sahip.
Bu tür bir teknoloji, elbette etkileyici olduğu kadar tehlikeli bir potansiyele de sahip. Bir kişinin fotoğrafı ile istediğiniz herhangi bir konuşmayı birleştirebilme yeteneği, yanlış bilgi yayma, birinin itibarını zedeleme gibi kötü niyetli amaçlar için kolayca kullanılabilir. Neyse ki, Microsoft, VASA-1’in ChatGPT veya Copilot gibi kamuya açık bir ürün olmayacağını belirtiyor. Şu an için VASA-1’i ticarileştirme planlarının bulunmadığını da ekliyor.
Microsoft’un VASA-1 çerçevesini test etmek için kullandığı görsellerin büyük bir kısmı, StyleGAN2 veya DALL-E 3 gibi yapay zeka ürünleri tarafından oluşturulmuş sanal kişilere dayanmaktadır. Microsoft’un bu testlerde kullandığı tek “ünlü” örnek ise, sanat tarihinin en ikonik eserlerinden biri olan Mona Lisa tablosudur.
Microsoft, VASA-1’in yalnızca bir araştırma projesi olarak geliştirildiğini vurguluyor. Bu kavram kanıtı, böyle bir yapay zeka işlevinin mevcut olduğunu gösteriyor. Son olarak, Microsoft, gelecekte bu teknolojiyi ticari bir ürüne dönüştürmenin mümkün olabileceğini belirtiyor; ancak bunun yalnızca “teknolojinin sorumlu ve uygun düzenlemelerle uyumlu bir şekilde kullanılacağından emin olduktan sonra” gerçekleştirileceğini ifade ediyor.