Google-ի նոր նեյրոցանցը կանխատեսում է գենոմում կետային մուտացիաների էֆեկտները
Google-ին պատկանող DeepMind ընկերությունը ներկայացրել է մեքենայական ուսուցման AlphaGenome մոդելը, որը կանխատեսում է կետային մուտացիաների ու գենետիկական տարբերակների էֆեկտները։ Ինչպես հաղորդում է Nature ամսագրում հրապարակված հոդվածը, նեյրոցանցը կանխատեսում է փոփոխությունների հետևանքները ոչ միայն գեներում, այլև ԴՆԹ չկոդավորող հատվածներում, որոնք կառավարում են գեների աշխատանքը։
Գենոմի կոդավորող հատվածները կազմում են գենետիկական փոփոխականության մոտ 98 տոկոսն ու կարող են ազդել գեների էքսպրեսիայի, ԴՆԹ փաթեթավորման, էպիգենետիկական նիշերի ու սպիտակուցների հետ փոխազդեցության վրա։
Մեքենայական ուսուցման գոյություն ունեցող մոդելները սովորաբար բախվում են երկու սահմանափակումների հետ։ Դրանք կամ վերլուծում են ԴՆԹ երկար հատվածները` կորցնելով ճշգրտությունն առանձին հիմնային զույգերի մակարդակում, կամ էլ աշխատում են ճշգրիտ, բայց կարճ կտորների վրա։ Բացի այդ, դրանցից շատերն էֆեկտը կանխատեսում են միայն մեկ կոնկրետ բնութագրով, օրինակ՝ էքսպրեսիայով կամ սփլայսինգով։
AlphaGenome-ը միավորում է այս երկու մոտեցումները։ Այն վերլուծում է մինչև մեկ միլիոն հիմնային զույգ երկարությամբ հաջորդականությունները մինչև մեկ զույգի կետայնությամբ ու միաժամանակ կանխատեսում մոլեկուլային բնութագրերի մի ամբողջ շարք՝ գեների սահմանները, սփլայսինգը, ՌՆԹ էքսպրեսիայի մակարդակը, քրոմատինի վիճակը, սպիտակուցների կապումն ու գենոմի հատվածների ֆիզիկական կոնտակտները։
Մոդելն ուսուցանվել է մարդու ու մկան գենոմների տվյալների խոշոր բազաների վրա` ENCODE, GTEx, 4D Nucleome ու FANTOM5 միջազգային նախագծերից։ AlphaGenome-ը զարգացնում է DeepMind-ի նախորդ` Enformer մոդելի գաղափարներն ու փոխլրացնում AlphaMissense մոդելը, որն աշխատում է կոդավորող մուտացիաների հետ։ Միևնույն ժամանակ, AlphaGenome-ի ուսուցումը համեմատաբար արագ ու պակաս ռեսուրսատար է ստացվել։
Թեստերում մոդելն իրեն դրսևորել է գոյություն ունեցող լավագույն լուծումներից ոչ վատ, իսկ շատ դեպքերում` անգամ ավելի ճշգրիտ։ Կարևոր է նաև այն, որ AlphaGenome-ը տալիս է միաժամանակ 11 մոդալությունների վրա հիմնված էֆեկտների միասնական քանակական գնահատական, այլ ոչ թե տարանջատված կանխատեսումներ։
Մոդելը ստուգելու համար հետազոտողները վերլուծել են սուր T-լիմֆոբլաստիկ լեյկեմիայի հետ կապված մուտացիաները։ Մոդելը ճշգրիտ մատնացույց է արել, որ դրանք ակտիվացնում են TAL1 օնկոգենը՝ ստեղծելով MYB տրանսկրիպցիայի գործոնի կապման ԴՆԹ հատված, որն էլ այս հիվանդության զարգացման հայտնի մեխանիզմն է։
Հետազոտողները սպասում են, որ AlphaGenome-ն օգտակար կլինի հիվանդությունների մեխանիզմների ուսումնասիրման համար, ինչպես նաև սինթետիկ կենսաբանության ու գենոմի հիմնարար հետազոտությունների մեջ։
