Yapay Zeka ile Müzik Üretimi: Beyin Aktivitesinden Melodilere
Her ay karşımıza çıkan yeni ürünler, programlar ve deneyler, üretken yapay zekanın potansiyelinin ne denli büyük olduğunu gözler önüne seriyor. Bu bağlamda, Google, bu teknolojinin etkileyici bir yönünü ortaya koyan ilginç bir örnek ile karşımıza çıkıyor. Japonya’daki araştırmacılarla iş birliği yapan Google, işlevsel manyetik rezonans görüntüleme (fMRI) kullanarak insan beyin aktivitelerinden müzik üretmenin bir yolunu keşfetti.
Google’ın “Brain2Music: İnsan Beyin Aktivitesinden Müziği Yeniden Oluşturmak” başlıklı araştırma makalesinde, on farklı müzik türünden oluşan 540 parça müzikten alınan 15 saniyelik kliplerin rastgele seçildiği belirtiliyor. Beş katılımcı, bu klipleri bir çift MRI uyumlu kulaklıkla dinlerken beyin aktiviteleri tarandı. Araştırmacılar, “katılımcının maruz kaldığı müzik türlerini tahmin etmek ve yeniden yapılandırmak” amacıyla elde ettikleri verileri MusicLM sistemine yüklediler.
Elde edilen sonuçlar, oluşturulan müziğin deneklerin orijinal olarak dinledikleri müzikle “anlamsal düzeyde” benzerlikler taşıdığını ortaya koydu. Yeniden oluşturulmuş beyin aktivitesi müziklerinden bazılarını dinlemek isterseniz, Google’ın bu çalışma için oluşturduğu web sayfasını ziyaret edebilirsiniz.
Araştırma ekibi, yapay zeka ile üretilen müziğin kalitesini etkileyen üç önemli faktörü de şu şekilde sıralıyor:
- fMRI verilerinin sınırlamaları: Bu veriler, zamansal ve uzamsal olarak oldukça seyrek bir şekilde toplanmıştır (gözlemlenen bölgeler 2×2×2 mm3 boyutundadır ve bu, insan nöronlarının boyutundan çok daha büyüktür).
- Müzik gömme yöntemleri: Yeniden oluşturulan müzik, yalnızca 128 sayıyla temsil edilen on saniyelik müziği kullanan MuLan gibi sınırlı sistemlerden faydalanmaktadır.
- Müzik üretim sisteminin kısıtlamaları: MusicLM’yi incelediğimizde, hem metin istemine bağlı kalma biçimi hem de üretilen sesin aslına uygunluğu açısından önemli iyileştirmelere ihtiyaç olduğunu gördük.
Birçok dil modelinde olduğu gibi, bu çalışmanın da gelecekte çok daha fazla gelişme kaydetme potansiyeli bulunuyor. Ancak şu an itibarıyla, yapay zekanın duyduğunuz sesleri yeniden oluşturmak için beyin aktivitenizi etkili bir şekilde kullanabileceği kanıtlanmış durumda. Yine de, bir yabancının beyin dalgalarınızı tarayarak düşüncelerinizi çalmasından endişe ediyorsanız, muhtemelen – en azından şimdilik – bu konuda fazla endişelenmenize gerek yok. Ekip, gönüllülerin bu çalışma için büyük bir fMRI tarayıcısında saatlerce vakit harcamak zorunda kaldığını vurguluyor.