2025-02-23

Şimdiye Kadarki En Büyük Yapay Zeka Biyoloji Modeli DNA Yazıyor

Şimdiye Kadarki En Büyük Yapay Zeka Biyoloji Modeli DNA Yazıyor

Bilim insanları, biyoloji alanında şimdiye kadar geliştirilmiş en büyük yapay zeka (YZ) modelini duyurdu. "Evo-2" adı verilen bu model, insanlardan tek hücreli bakterilere ve arkelere kadar yaşam ağacını kapsayan 128.000 genom üzerinde eğitildi. Model, kromozomları ve küçük genomları sıfırdan yazabiliyor, ayrıca hastalıklarla bağlantılı "kodlamayan" gen varyantları gibi mevcut DNA’yı anlamlandırabiliyor.

Evo-2, California’daki Arc Enstitüsü, Stanford Üniversitesi ve çip üreticisi NVIDIA’daki araştırmacılar tarafından ortaklaşa geliştirildi. Model, bilim insanlarının web arayüzleri üzerinden kullanabileceği şekilde sunuluyor ya da tamamen ücretsiz olarak yazılım kodu, veri ve diğer parametreleriyle indirilebiliyor. Geliştiriciler, Evo-2’yi başkalarının kendi ihtiyaçlarına göre uyarlayabileceği bir platform olarak görüyor. Arc Enstitüsü’nden biyomühendis Patrick Hsu, bu modelin biyoloji için bir "uygulama mağazası" gibi işleyeceğini ve bilim insanlarının onu nasıl geliştireceğini merakla beklediklerini belirtti.
Diğer bilim insanları, Arc Enstitüsü’nün web sitesinde yayımlanan ve bioRxiv ön baskı sunucusuna gönderilen makalede anlatılan modelden etkilendiklerini söylüyor. Ancak, modelin performansını tam olarak değerlendirebilmek için bağımsız testlere ihtiyaç duyduklarını ifade ediyorlar. Stanford Üniversitesi’nden hesaplamalı genom bilimci Anshul Kundaje, Evo-2’nin mühendislik açısından etkileyici olduğunu, ancak ön baskı yayımlandıktan sonra nasıl bir performans sergileyeceğini görmek gerektiğini vurguladı.

Modelin Eğitimi ve Özellikleri
Son yıllarda araştırmacılar, protein dizileri üzerinde eğitilen ve protein yapılarını tahmin etmek ya da yeni proteinler tasarlamak için kullanılan güçlü "protein dili modelleri" geliştirdi. Örneğin, eski Meta çalışanları tarafından geliştirilen ESM-3 modeli, gen editörleri ve floresan moleküller gibi yeni proteinler tasarlamak için kullanıldı. Ancak Evo-2, bu modellerden farklı olarak, protein yapım talimatlarını taşıyan "kodlayan diziler" ile genlerin ne zaman, nerede ve nasıl aktif olduğunu kontrol eden "kodlamayan DNA" da dahil olmak üzere genom verileri üzerinde eğitildi.

Geçen yıl piyasaya sürülen ilk Evo sürümü, 80.000 bakteri ve arke (prokaryotlar) genomu ile virüsler ve diğer diziler üzerinde çalışmıştı. Yeni model Evo-2 ise insan, hayvan, bitki ve diğer ökaryotik organizmaların genomlarını da kapsayan 128.000 genomla eğitildi. Bu genomlar toplamda 9.3 trilyon DNA harfi içeriyor. Hsu’ya göre, bu veriyi işlemek için gereken hesaplama gücü ve diğer özellikler, Evo-2’yi bugüne kadarki en büyük biyolojik YZ modeli yapıyor.

Karmaşık Genomları Çözme Yeteneği
Ökaryotik genomlar (örneğin maya gibi organizmaların genomları), prokaryotlara kıyasla daha uzun ve karmaşık. Genler, kodlayan ve kodlamayan bölgelerin iç içe geçtiği segmentlerden oluşuyor ve "düzenleyici DNA" genlerden çok uzakta olabiliyor. Evo-2, bu karmaşıklığı yönetmek için 1 milyon baz çifti kadar uzak mesafelerdeki DNA dizilerindeki kalıpları öğrenebilecek şekilde tasarlandı.
Modelin yeteneklerini göstermek için araştırmacılar, meme kanseriyle bağlantılı BRCA1 genindeki daha önce çalışılmış mutasyonların etkilerini tahmin etmek için Evo-2’yi kullandı. Hsu, modelin kodlayan bölgelerdeki değişikliklerin hastalığa neden olup olmayacağını belirlemede en iyi biyolojik YZ modellerine yakın bir performans sergilediğini ve kodlamayan mutasyonlar için ise en ileri düzeyde olduğunu söyledi. İleride bu model, hasta genomlarındaki anlaşılması zor değişiklikleri tanımlamaya yardımcı olabilir.
Ayrıca, Evo-2’nin yünlü mamut gibi karmaşık genomların özelliklerini çözme yeteneği de test edildi. San Francisco’daki Gladstone Enstitüleri’nden hesaplamalı biyolog Christina Theodoris, Evo-2’nin DNA’nın düzenleyici dilbilgisini öğrenmede önemli bir adım olduğunu belirtti.

Sonuç
Evo-2, biyolojide devrim yaratma potansiyeline sahip bir araç olarak görülüyor. Hem bilim insanlarının DNA’yı daha iyi anlamasına hem de yeni genetik araçlar geliştirmesine olanak tanıyabilir. Modelin açık erişimli olması, dünya genelindeki araştırmacıların onu kendi projelerine uyarlamasını kolaylaştırıyor. Ancak, gerçek performansı, bağımsız testlerle ortaya çıkacak.
https://www.nature.com/articles/d41586-025-00531-3 

Hiç yorum yok: