Google’ın Yeni Yapay Zeka ile Müzik Üretimi

Google Araştırmacılarından Yenilikçi Bir Yapay Zeka

Google araştırmacıları, metin tabanlı komutlardan dakikalar süren müzik parçaları üretebilen çığır açan bir yapay zeka geliştirdi. Bu yeni sistem, Model MusicLM olarak adlandırılıyor ve DALL-E benzeri bir işlevsellik sergiliyor. Yani, kullanıcılar ıslık çalarak veya mırıldanarak melodileri ifade ettiklerinde, yapay zeka bu melodileri farklı enstrümanlarla yeniden oluşturabiliyor.

Şirket, bu modeli kullanarak ürettiği çeşitli müzik örneklerini paylaştı ve sonuçlar gerçekten etkileyici. Model, müzikal tarzları, atmosferleri ve belirli enstrümanları belirten detaylı açıklamalardan yola çıkarak gerçek şarkılara benzeyen 30 saniyelik parçalar üretebiliyor. Örneğin, “melodik tekno” gibi basit bir ifadeden 5 dakikalık bir parça oluşturabiliyor.

  • electronic song played in a videogame (0:00-0:15)
  • meditation song played next to a river (0:15-0:30)
  • fire (0:30-0:45)
  • fireworks (0:45-0:60)

Yukarıdaki komutlar verildiğinde ortaya çıkan sesler, dinleyicilere etkileyici bir deneyim sunuyor. Şu an için herkesin kullanımına uygun olmayabilir, ancak bu, yapay zekanın önemli bir kilometre taşı olduğunu gösteriyor. Model, müzik eserlerinin bir insan tarafından bestelendiği izlenimini yaratabiliyor.

Demo sitesinde, modelin çello veya marakas gibi enstrümanların 10 saniyelik kliplerini üretmesi istendiğinde ortaya çıkan sonuçlar, belirli bir türün 8 saniyelik klipleri ve hatta bir hapishane kaçışına uyacak şekilde tasarlanmış müzik parçaları da yer alıyor. Ayrıca, “fütüristik kulüp” ve “akordeon death metal” gibi ilginç ifadelerin yorumlarını da içeriyor.

MusicLM, insan vokallerini bile simüle edebiliyor. Seslerin tonunu ve genel kalitesini başarılı bir şekilde yakalasa da, bazı hatalı ses kaliteleri mevcut. Bu durumu en iyi şekilde tanımlamak gerekirse, seslerin grenli veya durağan bir yapıda olduğunu söyleyebiliriz. Bu kalite, yukarıdaki örnekte o kadar belirgin olmayabilir, ancak bazı örneklerin bunu oldukça iyi gösterdiği söylenebilir.

Şarkı sözlerinin mantıksız olduğunu anlama ihtimaliniz yüksek, ancak dikkat etmediğinizde fark edilmeyecek şekilde – sanki “Simlish” dilinde şarkı söyleyen birini dinliyorsunuz veya İngilizce gibi görünmesine rağmen aslında İngilizce olmayan bir parçayı dinliyormuşsunuz gibi bir deneyim sunuyor. Google’ın bu sonuçları nasıl elde ettiğine dair derinlemesine bilgi edinmek için, bu konuyu detaylı bir şekilde ele alan bir araştırma makalesine göz atabilirsiniz.