Искусственный интеллект научили выявлять гены, связанные с болезнями

4

Журнал Nature Communications опубликовал исследование ученых из Университета Линчёпинга. Их работа демонстрирует, как искусственная нейронная сеть выявляет закономерности в огромном количестве данных по экспрессии генов и обнаруживает группы, связанные с болезнями. Ученые рассчитывают, что нейронная сеть может найти применение в точной медицине и подборе индивидуального лечения.

Для понимания работы нейросети ученые проводят аналогию с социальной сетью. Фейсбук предлагает рекомендуемых друзей на основании того, что вы общаетесь, имеете общих друзей или просматриваете один и тот же контент. Ученые создают карты биологических сетей похожим образом, устанавливая, как всевозможные гены или белки взаимодействуют друг с другом. Ученые решили привлечь искусственный интеллект, чтобы выяснить, может ли он обнаруживать такие сети в результате глубокого обучения, в ходе которого искусственные нейронные сети получают экспериментальные данные.

Сегодня известно, что такие нейронные сети уже умеют распознавать шаблоны в огромном количестве сложных данных. Такие сети уже используют в приложениях, которые распознают изображения или детали этих изображений.

«Это первый случай глубокого обучения для поиска генов, которые связаны с болезнями. Это очень перспективный метод для анализа больших объемов данных о биологическом состоянии человека.» – говорит Санджив Двиведи, доктор факультета физики, химии и биологии (IFM) в университете Линчёпинга.

Для обучения нейросети ученые использовали базу данных с информацией о паттернах экспрессии более 20 000 генов у разных людей. Все данные были собраны хаотично – их не рассортировали на паттерны экспрессии у здоровых людей и те, что принадлежат людям с заболеваниями. Модель AI обучили поиску паттернов экспрессии в таком виде.

Сказать точно, как искусственный интеллект решает задачу, невозможно. Его иногда называют «черным ящиком», потому что никто точно не знает, как работает нейросеть и какие шаги она предпринимает для решения задачи. Можно лишь предоставить вводные данные и увидеть результат работы.

Современные искусственные нейронные сети имеют многослойную структуру и обрабатывают информацию математически. Сети имеют входной слой для ввода данных и выходной – для выдачи результата. Между ними находятся еще несколько слоев, в которых и происходят вычислительные операции. В ходе обучения сети поиску паттернов экспрессии генов ученые пытались заглянуть внутрь «черного ящика».

«Когда мы исследовали нашу обучаемую нейронную сеть, выяснилось, что первый скрытый слой изучает взаимодействие между различными белками. В более глубоких слоях нейросети, на третьем уровне, мы увидели группы разных типов клеток. Представляет большой интерес то, что этот тип биологически релевантной группировки генерируется автоматически, учитывая факт, что наша сеть обучалась на основе несекретных данных по экспрессии генов.» – говорит Мика Густафссон, старший преподаватель IFM и руководитель исследования.

Ученые изучили, можно ли использовать их модель экспрессии генов, чтобы находить паттерны генов, связанных с болезнями и нормальные паттерны. Они подтвердили, что модель успешно находит паттерны, которые согласуются с процессами в человеческом организме. Модель обучали на основе не засекреченных данных, поэтому есть вероятность, что нейросеть нашла новые закономерности.

«Ключом к развитию этого метода станет хорошее понимание нейросети. Она может научить нас новым данным о биологических контекстах, например, болезнях, в которых взаимодействуют различные моменты. И мы считаем, что наш метод обучения дает новые модели, которые легче анализировать и это может быть использовано для многих видов биологической информации» – говорит Мика Густафссон.

Густафссон выразил надежду, что тесное сотрудничество с медицинскими центрами позволит применять эту модель на практике. Нейросеть может помочь определить, какие лекарства должны получать пациенты, или же выявлять пациентов с наиболее сильными патологиями. Проект уже получает финансирование от Шведского фонда стратегических исследований (SSF) и Шведского исследовательского совета.