Minecraft’ta Yüksek Standartta Oynayan Yapay Zeka Geliştirdi
OpenAI uzmanları, Minecraft’ı insan oyuncular kadar yüksek bir standartta oynayabilen bir sinir ağı geliştirdi. Geliştirilen bu sinir ağı, klavye ve fare girişlerinin kaydedildiği, yüklenicilerin belirli oyun içi görevleri yerine getirdiği küçük bir video veritabanıyla desteklenen yaklaşık 70.000 saatlik çeşitli oyun içi görüntülerle eğitildi. İnce ayar sürecinin ardından OpenAI, modelin yüzme, avlanma ve avladığı hayvanları tüketme gibi karmaşık görevleri başarıyla yerine getirebildiğini gözlemledi. Ayrıca, oyuncunun zıplayarak yükselmek için altına bir malzeme bloğu yerleştirdiği özel bir hareket olan “sütun tırmanmayı” da kavrayabildi.
Belki de en etkileyici başarılarından biri, yapay zekanın, OpenAI tarafından bilgisayar aracılığıyla gerçekleştirilen benzeri görülmemiş bir başarı olarak tanımlanan uzun bir dizi eylemi başarıyla yerine getirerek elmas araçları üretebiliyor olmasıdır. Minecraft projesi, şirketin Video PreTraining (VPT) adı verilen yapay zeka modellerinin eğitiminde yeni bir tekniğin başarılı bir şekilde uygulandığını gösterdiği için büyük bir önem taşımaktadır. Geçmişte, yapay zeka modellerini eğitmek için ham videoları kullanmanın en büyük zorluğu, videoların anlaşılması için yeterince basit olmamasıydı. Ancak bu video eğitimleri, sonuçların nasıl elde edileceğini öğretmiyordu. Gerçekte, AI modeli istenen sonuçları öğrenemiyor; buna karşın bu sonuçlara ulaşmak için gereken girdi kombinasyonlarını anlamakta zorluk yaşıyordu.
VPT ile OpenAI, temel bir model oluşturmak için ilgili klavye ve fare hareketleriyle etiketlenmiş dikkatlice seçilmiş görüntü havuzunu, halka açık web kaynaklarından alınan büyük bir video veri kümesiyle eşleştiriyor. Ekip, temel model üzerinde ince ayar yapmak amacıyla belirli görevleri öğretmek için tasarlanmış daha küçük veri kümeleri ekliyor. Bu bağlamda, OpenAI, ağaçları kesme ve üretim istasyonları inşa etme gibi erken oyun eylemlerini gerçekleştiren oyuncuların görüntülerini kullanıyor. Bu yaklaşımın, modelin bu görevleri yerine getirme yeteneğinde “büyük bir gelişme” sağladığı belirtiliyor.
Bir diğer önemli teknik ise, pekiştirmeli öğrenme olarak bilinen bir uygulamadır. Bu süreçte, AI modelinin bir dizi görevdeki her adımı başarıyla tamamlaması için “ödüllendirilmesi” sağlanıyor. Bu yöntem, sinir ağının insan düzeyinde başarı oranına ulaşarak elmas kazma işlemi gerçekleştirebilmesi için gerekli tüm malzemeleri toplamasını mümkün kıldı. OpenAI tarafından yayımlanan bir blog yazısında, “VPT, yalnızca dilden daha fazla alanda doğrudan büyük ölçekli davranışsal öncelikleri öğrenmenin heyecan verici olasılığını sunuyor. Sadece Minecraft’ta deneyler yapsak da, oyunun kapsamı çok geniş ve yerel insan arayüzü (fare ve klavye) oldukça genel, bu nedenle sonuçlarımızın diğer benzer alanlar, örneğin bilgisayar kullanımı için de umut verici olduğunu düşünüyoruz.” ifadelerine yer verildi.