DeepMind’dan Çığır Açan Yapay Zeka Teknolojisi
Google’ın DeepMind yapay zeka laboratuvarı, videolara eşlik edecek müzikler ve diyaloglar oluşturabilen yenilikçi bir teknoloji üzerinde çalışıyor. Bu laboratuvar, Google’ın Veo ve OpenAI’nin Sora’sı gibi diğer video oluşturma araçlarıyla uyumlu bir şekilde çalışabilen videodan sese (V2A) teknolojisi projesindeki gelişmeleri bir tanıtım videosuyla paylaştı. DeepMind ekibi, blog yazısında sistemin ham pikselleri anlayabildiğini ve ekranda olup bitenler için ses efektleri oluşturmak amacıyla bu bilgileri metin istemleriyle birleştirebildiğini öne sürdü.
Yeni yapay zeka aracı, sessiz filmler ve diğer sessiz videolar gibi geleneksel çekimler için arka plan müzikleri oluşturmak üzere de kullanılabilme potansiyeline sahip. Bu teknoloji, görsel içeriklerin içindeki duygusal ve atmosferik unsurları güçlendirmeyi hedefliyor.
Yapay Zekayı Eğitme Süreci
DeepMind’ın araştırmacıları, bu yapay zekayı videolar, ses kayıtları ve seslerin detaylı açıklamalarını içeren geniş bir veri seti üzerinde eğittiklerini belirtiyor. Bu sayede yapay zeka, belirli sesleri görsel sahnelerle ilişkilendirmeyi öğrendi. Yeni araçta metin istemi kullanmak isteğe bağlı olsa da, son ürünü mümkün olduğunca doğru ve gerçekçi hale getirmek için kullanıcılar metin üzerinden yapay zekaya müdahalede bulunabiliyorlar.
- Kullanıcılar, çıktıyı istedikleri sesleri oluşturmaya yönlendirmek için olumlu istemler kullanabiliyor.
- Ayrıca, istenmeyen seslerden kaçınmak için olumsuz istemler de girebiliyorlar.
Örneğin, ekip aşağıdaki örnek istemi kullanarak bir ses efekti oluşturdu: “Sinematik, gerilim, korku filmi, müzik, gerilim, ambiyans, beton üzerindeki ayak sesleri.” Videodaki ses efektleri henüz çok etkileyici ve gerçekçi görünmese de, bu alanda bir başlangıç olduğunu ve teknolojinin kısa sürede kendini geliştireceğini unutmamak gerekiyor.