Yapay Zeka ve Oyun: SUTD’nin Çığır Açan Araştırması

Singapur Teknoloji ve Tasarım Üniversitesi’nden (SUTD) bilim insanları, karmaşık hareket tasarımını anlamaya yönelik yenilikçi bir yazılım geliştirdi. Bu yazılım, takviyeli öğrenme ve faz değişim belleği etrafında şekillenen bir yapı ile tasarlandı. Önceki araştırmalar, derin öğrenme tekniklerinin satranç veya Go gibi strateji oyunlarına uygulanması üzerine yoğunlaşmışken, SUTD ekibi bu kez D-PPO algoritmasını Street Fighter Champion Edition II gibi zorlu bir oyuna uygulamayı tercih etti.

Bu araştırma kapsamında, SUTD araştırmacıları yapay zeka oyuncusu SF-R2‘yi, bilgisayara karşı iki gün boyunca ardışık bir şekilde oynatarak eğitti. Bu sıkı eğitim sürecinin ardından, yapay zeka, bir Street Fighter şampiyonunu yenmeyi başardı ve kendisinden beklenenin ötesine geçerek önemli bir başarıya imza attı. Araştırma makalesinde belirtilenlere göre, bu çalışma hareket biliminin daha geniş kapsamlı sonuçlar doğurabileceği potansiyeli taşıyor. Örneğin, robotik ve otonom araçların geliştirilmesinde devrim niteliğinde bir rol oynayabilir.

Ayrıca, makinelerin insan normlarını gözlemleyip bunları taklit etme ve daha iyi performans gösterme çabalarını destekleyen alanlarda geniş bir eğitim potansiyeli sunuyor. Yapay zeka araştırmacılarının geliştirdikleri sistemlerin etkinliğini değerlendirmek için kullandıkları en yaygın yöntemlerden biri, bu sistemleri farklı oyun türlerinde insan oyuncularla kıyaslamaktır. Örneğin, 2017 yılında DeepMind tarafından geliştirilen Alpha Go yapay zekası, bir önceki yıl Fan Hui’ye karşı kazandığı ilk zaferin ardından, dünyanın bir numaralı insan Go oyuncusunu ikinci kez yendi. Bunun yanı sıra, Microsoft’un yapay zekası da Haziran ayında dünyanın ilk kusursuz Ms. Pac-Man skorunu elde etti. Ayrıca, Ağustos ayında bir OpenAI motorunun en iyi Dota 2 oyuncularını mağlup ettiğine tanık olduk.

Bir Street Fighter şampiyonunu yenerek elde edilen bu son başarı, yalnızca takviyeli öğrenme yöntemine değil, aynı zamanda faz değişimli bellek teknolojisine de dayanmaktadır. İlk olarak HP tarafından geliştirilen bu bellek türü, kalkojenit cam üzerindeki alanları değiştirmek için elektrik yükleri kullanarak elde edilen bir tür uçucu olmayan bellek sistemidir. Bu teknoloji, yaygın olarak kullanılan Flash belleklerden çok daha hızlıdır.

Baş araştırmacı Desmond Loke, TechXplore’a verdiği demeçte, “Yaklaşımımız benzersizdir; çünkü en iyi insan oyuncularının performansını aşan hareketler yaratmak için takviyeli öğrenmeyi kullanıyoruz. Bu, daha önceki yöntemler kullanılarak mümkün olmamıştı ve yaratıcılığımızı dönüştürme potansiyeline sahip bir yaklaşım sunuyor” şeklinde konuştu.