Google'un yapay zekâsı, matematik olimpiyatlarında altın madalya kazananlardan daha iyi performans gösteriyor.
Google araştırmacıları, Uluslararası Matematik Olimpiyatı’ndaki (IMO) geometri sorularının %84’ünü çözebilen "AlphaGeometry2" (AG2) adlı bir yapay zekâ sistemi geliştirdi. Olimpiyat altın madalyalılarının ortalama başarı oranı ise %81,8.
DeepMind tarafından geliştirilen AG2, yalnızca desen eşleştirme değil, aynı zamanda yaratıcı problem çözme yeteneğine de sahip. Araştırmacılar, bu çalışmanın bulgularını 7 Şubat'ta arXiv’de yayımladı.
Google, bu duyuruyu Microsoft’un rStar-Math adlı gelişmiş matematik yapay zekâsını tanıtmasından bir ay sonra yaptı. Microsoft’un sistemi, küçük dil modelleri (SML) kullanarak karmaşık denklemleri çözüyor. AG2 ise karmaşık geometri problemlerini çözmek için hibrit bir akıl yürütme modeli kullanıyor.
Ocak 2024’te yayımlanan AlphaGeometry’nin yeni versiyonu, önceki sürüme göre %30 daha iyi performans gösteriyor. AG2, görsel akıl yürütme ve mantığı birleştirerek geometri alanında ustalaşmayı hedefliyor.
Uzmanlar, bu gelişmeyi yapay genel zekâ (AGI) olarak görmenin doğru olmayacağını belirtiyor. Cambridge Üniversitesi mezunu bilgisayar bilimci ve SER Group CEO’su John Bates, “AlphaGeometry2 bir zeka formu sergiliyor, ancak insan zekası bundan çok daha fazlasını içeriyor. Bizler bilgiyi yalnızca uygulamakla kalmayıp aynı zamanda yeni fikirler üretiyoruz,” dedi.
AG2, nöral dil modelleri ile sembolik motorları birleştirerek çalışıyor. Dil modeli, geometri problemlerine yardımcı yapılar önerirken, sembolik motor bunları test ediyor. Eğer bir yapı işe yaramazsa, sistem yeni yapılar önererek çözüm arayışına devam ediyor.
AG2’nin önceki versiyona göre daha başarılı olmasının nedeni, daha büyük ve çeşitli veri kümeleriyle eğitilmiş bir nöral dil modeli ile daha hızlı bir sembolik motor kullanması. Ayrıca, geometri ispatlarını arayıp bulmada etkili bir algoritmaya sahip.
Ancak AG2’nin bazı sınırlamaları var: Çözüm süresi uzun, 3D geometri, doğrusal olmayan denklemler veya değişken noktalar içeren en zorlu IMO geometri problemlerini çözemiyor. Ayrıca, çözümlerini insan dilinde açıklayamıyor.
DeepMind, AG2’nin matematiksel akıl yürütmede ilerlemeler sağladığını ve bu gelişmelerin mühendislik tasarımı, otomatik sistem doğrulama, robotik, ilaç araştırmaları ve genom bilimi gibi alanlara uygulanabileceğini belirtiyor. Gelecek versiyonlarda daha fazla geometrik kavramı desteklemeyi, problemleri alt gruplara ayırmayı ve işlem hızını artırmayı hedefliyorlar.
Hiç yorum yok:
Yorum Gönder