Новая ИИ-модель Evo 2: Прорыв в проектировании геномов и предсказании мутаций

Ученые из Arc Institute создали модель под названием Evo 2, которая способна анализировать генетический материал, предсказывать заболевания и мутации, а также разрабатывать новые геномы, сопоставимые по длине с геномами простейших бактерий.

В своей работе эксперты сотрудничают с Nvidia, Стэнфордским университетом, Калифорнийским университетом в Беркли и Калифорнийским университетом в Сан-Франциско. Их нейросеть обучалась на ДНК более 100 000 разных видов организмов.

Исходный код Evo 2 доступен на GitHub и также внедрен в платформу Nvidia BioNeMo. Arc Institute взаимодействовал с исследовательским центром в области искусственного интеллекта Goodfire для создания визуализатора механистической интерпретируемости, который выявляет важные биологические особенности и закономерности. Модель обучается определять их в геномных последовательностях.

«Evo 2 является самой крупной моделью ИИ в области биологии на сегодняшний день, прошедшей обучение на более чем 9,3 триллиона нуклеотидов — основополагающих единицах ДНК и РНК. […] Evo 2 включает в себя информацию о человеке, растениях, а также различных одноклеточных и многоклеточных организмах в эукариотической сфере», — указано в пресс-релизе.

Нейросеть обладает широкими знаниями о древе жизни, что позволяет ей эффективно решать множество задач, включая предсказание мутаций и проектирование генетического кода для создания искусственной жизни.

«Эволюция зафиксировала биологическую информацию в молекулах ДНК и РНК, формируя закономерности, которые Evo 2 в состоянии обнаружить и использовать», — подчеркнули авторы исследования.

Для обучения модели было задействовано более 2000 графических процессоров Nvidia H100. Evo 2 способен одновременно обрабатывать генетические последовательности длиной до 1 миллиона нуклеотидов, что позволяет ей выявлять связи между удаленными участками генома.

В ходе тестирования модели с мутациями гена BRCA1, который связан с риском рака молочной железы, Evo 2 смогла с точностью свыше 90% предсказать, какие изменения являются безвредными, а какие — потенциально опасными.

Исследовательская команда уверена, что на основе Evo 2 можно разработать более узкоспециализированные модели ИИ.

Напоминаем, что в июле 2024 года китайские ученые создали робота с искусственным мозгом, вырастили в лаборатории, который способен обучаться выполнению разнообразных задач.

Ранее Meta AI представила «модель белкового языка» ESM-2, обладающую 15 миллиардами параметров, а также базу данных ESM Metagenomic Atlas, содержащую свыше 600 миллионов прогностических структур метагеномных соединений.