Google, I/O Konferansında Yeni Yapay Zeka Modellerini Duyurdu
Google, yıllık geliştirici konferansı I/O’da, şirketin en hafif ve en verimli yapay zeka modelleri olarak tanıttığı yeni modelleri duyurdu. Bu modeller, kullanıcıların bilgiye daha hızlı ve etkili bir şekilde erişmesini hedefliyor.
Gemini 1.5 Flash, Google I/O’da tanıtılan ilk yeni model olarak dikkat çekiyor. Gemini serisinin en yeni üyesi olan bu model, konuşmaları anında özetleme, resim ve videolara başlık ekleme ve büyük belgelerden veri çıkarma gibi yeteneklere sahip. Google DeepMind CEO’su Demis Hassabis, basın brifinginde “Geliştiricilerden daha hızlı ve daha uygun maliyetli bir şey istediklerini duyduk” ifadelerini kullandı. Bu tanıtım, teknoloji devlerinin ürün geliştirme süreçlerini giderek daha fazla yapay zeka etrafında şekillendirdiği bir dönemde gerçekleşiyor. Yeni araçlar, tüketicilere geleneksel web aramalarına kıyasla daha gelişmiş ve yaratıcı bilgi erişim yolları sunuyor, bu da Google için özel bir önem taşıyor.
Bilindiği gibi, OpenAI de, pazartesi günü yeni bir kullanıcı arayüzü ile birlikte ChatGPT’nin yeni bir yapay zeka modelini ve masaüstü sürümünü piyasaya sürdü. Şirket, GPT-4o olarak adlandırılan yeni modelin, GPT-4 Turbo’dan iki kat daha hızlı ve yarı maliyetli olduğunu belirtti. Şimdi Google, yeni modeliyle OpenAI’ye meydan okumayı amaçlıyor.
Gemini 1.5 Pro, Gemini’nin bir diğer yeni sürümü olarak öne çıkıyor. Bu model, birden fazla büyük belgeyi (toplamda 1.500 sayfa) anlama yeteneğine sahip ve 100 e-postayı özetleyebiliyor. Google’da başkan yardımcısı ve Gemini deneyimleri genel müdürü olan Sissie Hsiao, Gemini 1.5 Pro’nun yakında bir saatlik video içeriğini veya 30.000 satırdan fazla kod tabanını işleyebileceğini açıkladı. Hsiao, “Kira sözleşmenizdeki evcil hayvan politikasının ayrıntılarını bulmak veya birden fazla uzun araştırma makalesinin temel argümanlarını karşılaştırmak gibi karmaşık belgeler hakkında hızlı bir şekilde yanıtlar ve içgörüler elde edebilirsiniz” dedi. Google, 35 dil ile Gemini 1.5 Pro’nun, bağlamı ölçen ve modelin bir seferde ne kadar bilgiyi işleyebileceğini belirleyen 2 milyon belirteç penceresine sahip olduğunu belirtiyor. Şirket yöneticileri, yeni modelin yerel muhakeme, planlama ve görüntü anlayışını geliştirdiğine vurgu yapıyor. Alphabet CEO’su Sundar Pichai ise, basın brifinginde Gemini 1.5 Pro için “Şimdiye kadar herhangi bir temel modelin en uzun bağlam penceresini sunuyor” dedi. Etkinlikte, Gemini’den çocuklarının okulundan gelen tüm son e-postaları özetlemesini isteyen bir ebeveyn örneği verildi. Gemini 1.5 Pro başlangıçta Workspace Labs’de test edilebilecekken, Gemini 1.5 Flash, Google’ın makine öğrenimi platformu Vertex AI’da denenecek.
Google Veo, Google’ın üretken video modeli olarak OpenAI’nin Sora’sına yanıt niteliğinde duyuruldu. Veo’nun geliştirici konferansında tanıtılması, Google’ın OpenAI’nin bu yılın başlarında duyurduğu Sora’ya meydan okuduğunu gösteriyor. Google DeepMind’ın CEO’su Demis Hassabis, Veo’yu bugüne kadarki en yetenekli üretken video modeli olarak tanımlıyor. Veo, kullanıcıların metin istemleri, görsel girdiler ve video istemleri kullanarak yüksek kaliteli (1080p’ye kadar) videolar oluşturmasına olanak tanıyor. Ayrıca Google, Veo için “görsel stiller arasında duygusal nüansı yakalayan ve çarpıcı sinematik efektler üreten içerikler oluşturmanızı sağlar” ifadesini kullanıyor. Sora yalnızca belirli geliştiricilere ve özel kullanıcı gruplarına sunulurken, Google, kullanıcıların Veo’yu denemek için bir bekleme listesine kaydolmalarına olanak tanıyor. Veo’ya erişim, ABD’den başlayarak Google’ın yeni deneysel aracı VideoFX aracılığıyla sağlanacak.