Yapay Zeka ile Ses Klonlama: Yeni Bir Dönem Başlıyor
Yapay zeka ile oluşturulan video görüntüleri, günümüzde birçok insan için bir korku kaynağı olmaya devam ediyor. Ancak, konuşma sırasında sesin doğal akışındaki takılmalar, sahte videolar ile gerçek olanları ayırt edebilmek için bir ipucu sunuyordu. Ne yazık ki, bu avantajımızı kaybetmek üzereyiz.
OpenAI, kısa süre önce Voice Engine adını verdiği yeni bir aracın küçük ölçekli bir demosunu tanıttı. Bu demo, yalnızca 15 saniyelik bir ses örneğini analiz ederek herhangi bir konuşmacının sesini taklit edebilen bir ses klonlama teknolojisini içeriyor. Şirket, bu teknoloji sayesinde duygusal ve gerçekçi sesler ürettiğini ve “kulağa doğal gelen konuşmalar” sağladığını belirtiyor. Bu gelişme, yapay zeka ile deepfake videoların artık daha geniş kitlelere ulaşmasının habercisi olabilir.
Geliştirilen teknoloji, önceden oluşturulmuş “metinden konuşmaya” API’sine dayanmakta ve yaklaşık 2022’den bu yana üzerinde çalışılmakta. OpenAI, mevcut “metinden konuşmaya” API’sini “sesli okuma” sistemiyle birleştirerek, yapay zeka ile sesler ve konuşmalar üretmeyi başarmıştı. Ancak şimdi, yapay zeka, bir kişinin sesini dinleyip aynı sesi taklit ederek konuşma yeteneğine sahip olacak.
Yararlı Olabileceği Alanlar
OpenAI, bu teknolojinin okuma yardımı, dil çevirisi veya dejeneratif konuşma koşullarından etkilenen bireyler için faydalı olabileceğini düşünüyor. Ancak bu yaklaşım, iyi niyetli bir çaba olarak değerlendirilebilir. Maalesef, kötü niyetli kişiler, başkalarının seslerini taklit ederek dolandırıcılık ve iftira gibi çeşitli kötü niyetli eylemler gerçekleştirmek için bu teknolojiyi rahatça kullanabilirler.
Özellikle sosyal medya platformlarında tanınan kişilerin seslerinin kötüye kullanılması, birçok insanın kaygı duymasına neden olabilir. OpenAI, şimdilik bu teknolojiyi, konuşma bozuklukları olan bireylerin kendi sesleriyle yapay konuşmalar üretmelerine yardımcı olmak amacıyla üniversitelerle geliştirmeyi planlıyor. Ancak, bu teknolojinin eninde sonunda daha geniş kitlelere açılacağını hepimiz biliyoruz.