Yapay Zeka ve Tıbbi Teşhis: AMIE’nin Başarısı
Google’ın gerçekleştirdiği bir araştırmaya göre, yapay zeka tabanlı bir sohbet robotu, metin odaklı görüşmelerde tıbbi hastalıkları teşhis etme ve bu bilgileri aktarma konusunda insan doktorlardan daha etkili bir performans sergiliyor. Bu sistemin adı Articulate Medical Intelligence Explorer (AMIE) olarak biliniyor ve tıbbi bilgi toplamak ve klinik etkileşimleri yürütmek amacıyla geliştirilmiş büyük bir dil modelidir.
AMIE, kullanıcıların tanımladığı semptomları incelemek, sorular yöneltmek ve olası teşhisleri tahmin etmek için tasarlanmıştır. Yapılan bir testte, sahte hastalıklarla başvuran 20 sahte hasta, insan etkileşiminde bir dokunuş katmak için deney için seçilen 20 profesyonel birinci basamak hekimiyle birlikte rastgele bir deney grubuna dahil edildi. Bu sahte hastalar, AMIE ile mi yoksa gerçek bir doktorla mı görüştüklerini bilmiyorlardı.
Katılımcılara, etkileşimlerinin kalitesini değerlendirmeleri istendi. Sonuçlar, denemede test edilen 149 vaka senaryosunda sahte hastaların çoğunun gerçek doktorlarla karşılaştırıldığında AMIE ile sohbet etmeyi daha çok tercih ettiğini ortaya koydu. Katılımcılar, AI sohbet robotunun endişeleri anlama konusunda daha başarılı olduğunu ve sağladığı yanıtların daha empatik, açık ve profesyonel bir üslup taşıdığını belirttiler.
AMIE’nin kişiliği ve tonu, daha tutarlı bir şekilde hareket edecek ve insanlara özgü yorgunluk ya da dikkat dağılması gibi sorunlardan etkilenmeyecek şekilde programlanabilmesi, bu sonuçların şaşırtıcı olmamasını sağlıyor. Ancak, AMIE’nin tıbbi sorunları teşhis etmedeki başarısı da dikkat çekici bir başka husus. Google’ın vurguladığı gibi, bu durum yapay zeka sohbet robotlarının tıbbi bakım sunma konusunda doktorlardan daha iyi olduğu anlamına gelmiyor.
Sonuçlar umut verici görünse de, birinci basamak hekimleri ile hastalar, yüz yüze etkileşimde bulunarak zamanla bir ilişki geliştirme fırsatına sahip oluyorlar. Klinisyenler, teşhis koyarken metin açıklamalarının ötesinde diğer bilgi türlerine de erişim sağlıyor ve bu yüzden Google’ın da kabul ettiği gibi, bu deneysel çalışma pratik bir uygulama değildir.
Google araştırmacıları, “Araştırmamızın çeşitli sınırlamaları bulunmaktadır ve bu bulgular dikkatle yorumlanmalıdır” açıklamasında bulunarak devam ediyorlar: “Özellikle, çalışmamızdaki klinisyenler, büyük ölçekli dil modellerinin (LLM) hasta etkileşimlerine izin veren ancak tipik klinik uygulamayı temsil etmeyen alışılmadık bir metin-sohbet arayüzü ile sınırlıdır. Bu nedenle, değerlendirme yöntemimiz muhtemelen insan etkileşimlerinin gerçek dünya değerini göz ardı etmektedir.”
Bu testin amacı, LLM’lerin birinci basamak hekimlerinin yerini alabileceğini göstermek değildi. Bunun yerine, Google, yapay zeka sohbet robotlarının sağlık hizmetlerine erişimi kısıtlı olan hastalar için faydalı destek araçları oluşturma potansiyeline sahip olduğuna inanıyor. Ancak, böyle bir teknolojinin gerçek dünyada uygulanmasının riskli olduğunu ve sorumlu bir şekilde kullanılması için daha fazla araştırma ve geliştirme gerektirdiğini de kabul ediyorlar.
Ekip, makalelerinde “Deneysel, simüle edilmiş öykü alma ve teşhis diyaloğunun sınırlı kapsamından, insanlar ve onlara bakım sağlayanlar için gerçek dünya araçlarına geçiş, teknolojinin güvenliği, güvenilirliği, adaleti, etkililiği ve mahremiyeti sağlamak için önemli miktarda ek araştırma ve geliştirme gerektirecektir.” şeklinde bir sonuca varıyor.