Nisan 19, 2024

PoderyGloria

Podery Gloria'da Türkiye'den ve dünyadan siyaset, iş dünyası

Meta, yeni nesil bir protein katlama modeli yarattığını söylüyor • The Register

Meta, yeni nesil bir protein katlama modeli yarattığını söylüyor • The Register

Meta’daki AI araştırmacıları, bugüne kadar türünün en büyük protein katlama modelini geliştirdiklerini ve 600 milyondan fazla proteinin yapısını tahmin edebildiklerini söylüyorlar.

takım göğüs 15 milyar varyanttan oluşan ESM-2 adaptörüne ve protein yapısı tahminleri için bir veri tabanına dayanan model, Atlas Metagenomik ESM, Salı günü. Bu veri tabanı, bilim adamlarının henüz gözlemlemediği protein izoformlarını içerir.

Proteinler, 20’ye kadar amino asit türü içeren karmaşık biyolojik moleküllerdir ve canlı organizmalarda her türlü biyolojik işlevi yerine getirirler. En önemlisi, karmaşık 3B yapılara katlanırlar ve şekilleri, işlevleri açısından hayati önem taşır; Nasıl göründüğünü bilmek, bilim insanlarının nasıl çalıştığını anlamalarına yardımcı olur ve bundan yola çıkarak, bu davranışı taklit etmenin, değiştirmenin veya engellemenin yollarını keşfetmelerine yardımcı olur.

Ne yazık ki, sadece amino asit bileşimini alıp hemen nihai yapı üzerinde çalışamazsınız. Öğrenmek için simülasyonlar veya deneyler yapabilirsiniz, ancak bu uzun zaman alır. Bu günlerde, bir proteinin kimyasal yapısına uygun şekilde eğitilmiş makine öğrenimi yazılımı sağlayabilirsiniz ve model, nispeten hızlı ve doğru bir şekilde yapıyı tahmin edecektir.

Aslında DeepMind, AlphaFold modeliyle çok şey gösterdi. kazanmak – kazanmak 2020’de CASP Uluslararası Bienal Protein Katlama Yarışması. Amino asitlerin giriş zinciri nedeniyle AlphaFold ve diğer makine öğrenimi yazılımları, ilgili 3D yapıyı oluşturabilir.

O zamandan beri, Londra merkezli DeepMind araştırmacıları, sistemlerini gurur 200 milyondan fazla proteinin yapısı bilim tarafından bilinmektedir. Meta’nın en son ESM sistemi, milyonlarca protein dizisi üzerinde eğitildikten sonra yüz milyonlarca tahminde bulunarak daha da ileri gitti.

Meta ekibi tarafından hazırlanan ön makale – Lin ve diğerleri – ESM-2’nin tasarımını açıklıyor burada bulunabilir. İlginçtir ki, göre araştırmacılar, sistem aslında “evrimsel kalıpları öğrenmek ve doğrudan protein dizilerinden uçtan uca doğru yapısal tahminler üretmek için” tasarlanmış büyük bir dilsel modeldir. Örneğin AlphaFold bir model dil değildir ve farklı bir yaklaşım kullanır.

Boffin’in makalelerinde belirttiği gibi, bu büyük dil modelleri insan dilleriyle uğraşmaktan çok daha fazlası için kullanılabilir: “Onlarca ila yüz milyarlarca parametreye sahip modern dil modelleri, düşük hızlı dil çevirisi, mantıksal akıl yürütme ve matematik gibi yetenekler geliştirir. • Problem çözme Hepsi açık bir gözetim olmadan.

“Bu gözlemler, protein dizileri üzerinde eğitilmiş dilsel modellerle paralel bir görünüm biçimi olasılığını artırıyor.”

Sonuç, amino asitleri temsil eden bir metin dizisinden bir proteinin fiziksel şeklini tahmin etmek için dilsel bir modelin öğretilmesine rağmen, ESM-2’dir.

ESM-2, benzer sistemlerden daha hızlı yapıları öngören, türünün en büyük modelidir; Meta’ya göre, bir çıktı üretmek için on dakikadan fazla sürebilen AlphaFold veya Rosetta gibi önceki sistemlerden 60 kata kadar daha hızlı.

Model, ESM’nin Metagenomik Atlasını yaratmayı başardı ve 600 milyondan fazla yapıyı tahmin etti. MGnify90 2000 GPU üzerinde çalışan sadece iki haftada protein veritabanı. Tek bir Nvidia V100 GPU’da, 384 amino asitlik bir proteini simüle etmek sadece 14,2 saniye sürer. Araştırma makalesinden, Meta’nın, sisteminin daha fazla protein tahmin etmesine izin vererek, hızının anahtar şey olmasına rağmen, doğruluk açısından AlphaFold ile çoğunlukla, ancak tamamen eşleştiğini söylediği anlaşılıyor.

“Mevcut son teknoloji hesaplama araçlarını kullanarak, pratik bir zaman diliminde yüz milyonlarca protein zincirinin yapılarını tahmin etmek, büyük bir araştırma kurumunun kaynaklarını kullanarak bile yıllar alabilir. Metagenomik düzeyde tahminlerde bulunmak, Facebook sahibi, tahmin hızında bir atılım kritik önemde” dedi.

Meta, ESM-2 ve ESM Metagenomik Atlas’ın bilim adamlarının evrimsel tarihi incelemelerine veya hastalık ve iklim değişikliğiyle mücadele etmelerine yardımcı olarak bilimi ilerleteceğini umuyor. Pease, “Bu çalışmayı daha da genişletmek için, yeni proteinler tasarlamak ve sağlık, hastalık ve çevredeki zorlukların çözülmesine katkıda bulunmak için dilsel modellerin nasıl kullanılabileceğini araştırıyoruz.” ®