xAI’nin Yeni Yapay Zeka Modeli Grok-1.5V Tanıtıldı
Elon Musk’ın kurduğu xAI, yapay zeka alanında önemli bir adım atarak Grok isimli yapay zekasının görsel bilgileri işleyebilen ilk sürümünü tanıttı. Grok-1.5V, metin tabanlı içeriklerin yanı sıra belgeler, diyagramlar, grafikler, ekran görüntüleri ve fotoğraflar gibi çeşitli görsel materyalleri işleyebilen bir multimodal yapay zeka modeli olarak öne çıkıyor.
xAI, Grok’un yeteneklerinin gerçek dünyada nasıl uygulanabileceğine dair bazı örnekler paylaştı. Kullanıcılar, Grok’a bir akış şemasının fotoğrafını göstererek bunu Python koduna çevirmesini, bir çizimden yola çıkarak bir hikaye yazmasını ya da anlamakta zorlandıkları bir meme’i açıklamasını isteyebilecekler. Bu yeni sürüm, xAI’nın Grok-1.5’i tanıtmasından sadece birkaç hafta sonra piyasaya sürüldü.
Grok-1.5V’nin, selefi Grok-1.5’e göre belirli alanlarda önemli gelişmeler gösterdiği belirtiliyor. Örneğin, bu modelin kodlama ve matematik konularında daha yetkin olduğu ve belirli sorguları daha iyi anlayabilmek için daha fazla veri kaynağına erişim sağladığı ifade ediliyor. Ayrıca, daha uzun bağlamları işleyebilme yeteneği ile donatıldığı da vurgulanıyor.
xAI, ilk test kullanıcılarının ve mevcut kullanıcıların yakında Grok-1.5V’nin sunduğu yeniliklerden yararlanabileceğini belirtse de, bu yeni modelin ne zaman kullanıma sunulacağına dair kesin bir tarih vermedi. Bunun yanı sıra, Grok-1.5V’nin tanıtımıyla birlikte RealWorldQA adını verdiği yeni bir kıyaslama veri seti de yayınlandı.
RealWorldQA’nın 700 görselinden herhangi biri, kullanıcılar tarafından yapay zeka modellerinin değerlendirilmesinde kullanılabilecek. Her bir öğe, kolayca doğrulanabilir ve Grok gibi çok modlu yapay zeka modellerini zorlayabilecek sorular ve cevaplar içerecek şekilde tasarlanmış. xAI, teknolojisinin RealWorldQA ile OpenAI’ın GPT-4V ve Google Gemini Pro 1.5 gibi rakiplerine karşı test edildiğinde en yüksek puanı aldığını da iddia ediyor.