Dijital Demans? Yapay Zekâda Bilişsel Gerileme Belirtileri
Yapay Zekâ Yerine İnsan Doktorlar Daha Uzun Süre Görevde Kalabilir mi?
The BMJ'de yayımlanan bir çalışma, ileri düzey dil modellerinin erken dönem demans testlerinde hafif bilişsel bozukluk belirtileri gösterdiğini ortaya koyuyor. Bu bulgular, yapay zekânın klinik uygulamalardaki sınırlarını özellikle görsel ve yürütücü beceriler gerektiren görevlerde gözler önüne seriyor.
Yapay Zekâ ve Bilişsel Gerileme
Yapılan araştırmaya göre, büyük dil modelleri (chatbotlar), erken demans teşhisinde kullanılan testlerde hafif bilişsel bozukluk belirtileri sergiliyor. Ayrıca, eski sürümler, tıpkı yaşlanan insan hastalar gibi, bu testlerde daha düşük performans gösteriyor. Çalışma, yapay zekânın kısa sürede insan doktorların yerini alacağı varsayımını sorguluyor.
Yapay Zekânın Değerlendirilmesi
Araştırmacılar, Montreal Bilişsel Değerlendirme (MoCA) testi ile önde gelen dil modellerini değerlendirdi. Bu test, dikkat, hafıza, dil, görsel-uzamsal beceriler ve yürütücü işlevler gibi bilişsel yetenekleri ölçmek için kullanılıyor. Maksimum puan 30 olup, 26 ve üzeri normal kabul ediliyor.
Sonuçlar
- ChatGPT 4o: 26/30 puan (en yüksek).
- ChatGPT 4 ve Claude: 25/30 puan.
- Gemini 1.0: 16/30 puan (en düşük).
Tüm modeller, görsel-uzamsal ve yürütücü işlevlerde (ör. saat çizimi ve sayı-harf bağlantı görevleri) zayıf performans gösterdi. Özellikle Gemini modelleri, gecikmeli hatırlama görevinde başarısız oldu. Diğer alanlarda (isimlendirme, dil, soyutlama) chatbotlar genellikle başarılıydı.
Klinik Kullanım için Zorluklar
Araştırma, dil modelleri ile insan beyni arasındaki temel farklara dikkat çekiyor. Ancak tüm modellerin görsel soyutlama ve yürütücü işlevlerde başarısız olması, klinik uygulamalardaki potansiyel zayıflıkları ortaya koyuyor.
Sonuç olarak, araştırmacılar şu çıkarımı yapıyor: “Nörologlar yakın zamanda yapay zekâ modelleri tarafından işlerinden edilmeyecek gibi görünüyor. Ancak bulgularımız, bu modellerin bilişsel bozukluk belirtileri sergileyerek yeni bir hasta türü haline gelebileceğini gösteriyor.”
Kaynak:
“Age against the machine—susceptibility of large language models to cognitive impairment: cross sectional analysis” Roy Dayan, Benjamin Uliel ve Gal Koplewitz, 20 Aralık 2024, BMJ.
DOI: 10.1136/bmj-2024-081948
Hiç yorum yok:
Yorum Gönder