Apple’ın MGIE Modeli ile Yapay Zeka Düzenlemeleri

Apple’ın Yapay Zeka Atılımı: MGIE Modeli

Apple, iOS 17’ye eklenen bazı küçük özelliklerle birlikte, üretken yapay zeka alanında diğer teknoloji devlerinin gerisinde kalmış gibi görünüyor. Ancak şirket, bu durumun farkında ve 2024 yılı, Apple için yapay zeka anlamında önemli bir atılım yılı olacağa benziyor. Şu anda, herkes iOS 18’de genişletilmiş AI yetenekleri, gelişmiş bir Siri ve benzeri yapay zeka özelliklerinin yer almasını bekliyor. Fakat bu heyecan verici yeniliklerden önce, Apple mühendisleri, California Üniversitesi’nin Santa Barbara kampüsü ile iş birliği yaparak, doğal dil talimatlarını anlayabilen açık kaynaklı bir yapay zeka modelini tanıttı.

Bu yeni uygulama, Apple kullanıcıları için özel olarak geliştirilmiş değil; açık kaynak kodu sayesinde tüm geliştiricilere ve kullanıcılara erişim imkanı sunuyor. Apple, Photoshop’a Rakip Olabilir mi? “MGIE” (MLLM-Guided Image Editing) adı verilen bu yapay zeka modeli, kullanıcıların belirli standart komutlar vermesi durumunda üç farklı düzenleme işlemini gerçekleştirebiliyor:

  • Photoshop tarzı modifikasyonlar (kırpma, döndürme, arka plan değiştirme gibi işlemler)
  • Global fotoğraf optimizasyonu (parlaklık, kontrast ve keskinlik ayarlamaları)
  • Yerel düzenleme (görüntünün belirli alanlarının şekil, boyut ve renk gibi özelliklerini değiştirme)

MGIE hakkında yayımlanan makale, bu modelin karşılaştığı zorlukları da detaylandırıyor. Kullanıcı komutları genellikle yapay zeka sistemleri için belirsiz olabiliyor. Örneğin, “pizzanın daha sağlıklı görünmesini sağla” gibi bir cümle, yapay zeka tarafından net bir şekilde anlaşılamayabiliyor. Ancak geliştiriciler, MGIE’nin bu belirsizlikleri aşmada daha etkili olduğunu vurguluyorlar.

MGIE ile Neler Yapılabilir?

Apple’a göre MGIE, birçok çeşit görsel düzenleme gerçekleştirebilir. Örnek vermek gerekirse:

  • Kullanıcılar, bir su kütlesinin görüntüsüne şimşek ekleyebilir ve bu şimşeğin su üzerindeki yansımasını görebilirler.
  • Bir görüntünün arka planındaki istenmeyen nesneleri kaldırabilirler; mesela, fotoğrafa istemeden dahil olmuş birini silebilirler.
  • Bir tabak çöreği başka bir nesneye, örneğin bir pizzaya dönüştürülebilir.
  • Bulanık bir görüntüde odaklanmayı artırabilir ya da güzel bir fotoğraftaki filigran metnini kaldırabilirler.

Elbette, bu uygulama yapay zeka tabanlı fotoğraf düzenleme alanında ilk değil. Photoshop, uzun bir süredir kullanıcı komutlarına göre üretken yapay zeka düzenlemeleri sunmakta. Ancak MGIE, komut tabanlı bir yapay zeka görüntü düzenleyicisinin en pratik ve gerçekçi sonuçlar veren versiyonu olabilir.

Modelin açık kaynaklı oluşu, herkesin indirip kendi araçlarıyla entegre etmesine olanak tanıyor. Ayrıca uygulamanın küçük bir demosu da mevcut. Fakat şu anda, demoyu kullanmak isteyenler için uzun bir bekleme listesi bulunmakta. İşlem yapmak istediğinizde, yüzlerce kişinin sıraya girmesi nedeniyle uzun süre beklemek zorunda kalabilirsiniz.

Apple’ın MGIE’yi kendi platformlarına nasıl ve ne zaman entegre edeceği henüz belirsiz. Ancak 2024, bu entegrasyon için kesinlikle doğru bir zaman dilimi olarak öne çıkıyor.