Apple’ın Yeni Dudak Okuma Patenti: Siri’nin Sınırlarını Zorluyor
Apple’ın sesli asistanı Siri, birçok yeteneğe sahip olsa da, dudak okumak gibi bazı becerilerden yoksun. Ancak yeni bir Apple patenti, şirketin bu alanda önemli bir adım atmayı düşündüğünü gösteriyor. Patent başvurusu, Ocak 2023’te gerçekleştirildi ve sesli komutların analiz edilmesine yönelik bir dudak okuma sisteminin detaylarını içeriyor.
Patent belgelerinde, “Hey Siri”, “geç” veya “sonraki şarkı” gibi basit sesli komutların yanı sıra, kullanıcıların ağız hareketlerini analiz eden bir algoritmanın nasıl çalıştığına dair bilgiler yer alıyor. Apple Insider tarafından bildirildiği üzere, bu patent, Siri’nin ses tanıma sistemlerinde karşılaşılan belirgin sorunları ele alıyor. Arka plandaki gürültü, seslerin bozulmasına sebep olabilirken, insanların seslerini izlemek için kullanılan diğer sensörler de önemli miktarda pil ve işlem gücü tüketiyor.
Bu yeni sistemin, cihazın kamerasını kullanmak yerine ses tanıma yazılımının, kullanıcının ağız, boyun veya başı ile ilgili hareketleri kaydetmesi ve bu hareketlerin insan konuşmasını temsil edip etmediğini belirlemesi hedefleniyor. Apple’ın patentinde belirtildiği gibi, bu tür hareket algılama işlemleri için ivmeölçer veya jiroskop gibi sensörlerin kullanılması öneriliyor. Bu sensörlerin, mikrofona göre istenmeyen sinyallere karşı daha az duyarlı olduğu düşünülüyor.
Patent ayrıca, bu hareket algılama teknolojisinin AirPod’lara nasıl entegre edilebileceğine dair olasılıkları da içeriyor. Hatta bu verilerin, bir kullanıcının iPhone’unu veya gelecekteki “akıllı gözlükleri” desteklemek üzere nasıl kullanılabileceğine dair ipuçları veriyor. Bu bağlamda, patent belgesinde cihazların ince yüz kaslarını, titreşimleri veya kafa hareketlerini algılayabilmesi gibi detaylar sunuluyor.
Apple’ın akıllı gözlük projeleri yıllar önce durdurulmuş olsa da, şirketin yeni Vision Pro başlığı bu alanda dikkat çeken bir alternatif olabilir. Ancak, bu teknolojiyi hayata geçirmek için Apple’ın muhtemelen gelişmiş bir makine öğrenimi modeli geliştirmesi gerekecek. Patentte, “ilk dil modeli” olarak tanımlanan, çeşitli örnek veri setleri üzerinde eğitilmesi gereken bir modelin mevcut olduğu belirtiliyor.
- Apple’ın sesli asistanı Siri, dudak okumayı henüz gerçekleştiremiyor.
- Yeni patent, dudak okuma sisteminin detaylarını ve çalışma prensibini tanımlıyor.
- Patent, sesli komutlar ve ağız hareketlerinin analizi üzerine odaklanıyor.
- Sistem, ivmeölçer ve jiroskop gibi sensörleri kullanarak çalışacak.
- Teknoloji, AirPod ve akıllı gözlüklerle entegre olabilecek.
Elbette, Apple birçok patent başvurusu yapıyor, ancak bunların çoğu son ürünler haline dönüşmüyor. Ancak bu yeni patent, ses tanıma ve dudak okuma alanında önemli bir adım olma potansiyeline sahip.