Привет, Хабр! Физтех возобновляет цикл семинаров по искусственному интеллекту AI@MIPT. Сегодня Александр Фрей и Кевин О’Коннелл из Норвежского центра по изучению психологических расстройств (NORMENT) в городе Осло расскажут об использовании больших данных для математических моделей генома человека. Выступление можно будет посмотреть в группе Физтеха, оно пройдет на английском языке.
Генетика — область больших возможностей для машинного обучения. Наиболее репрезентативные полногеномные исследования (GWAS) уже проводятся на выборках, превышающих 1 млн человек, и содержат информацию по десяткам миллионов ассоциаций между геномными вариантами и фенотипическими признаками. По некоторым оценкам, в совокупности эти исследования покрывают 80% вариативности сложных черт человека, в том числе психических расстройств. Несмотря на это, сохраняется трудность перехода от полученного научного знания к клиническим приложениям. На практике персональная генетическая информация крайне редко применяется для прогнозирования заболеваний. В ходе лекции будут рассмотрены наиболее успешные полногеномные исследования и ограничения, которые препятствуют эффективному применению методов машинного обучения в генетике человека. Часть занятия будет посвящена статистической методологии, лежащей в основе подобных исследований, в том числе анализу байесовских смешанных моделей и методу ограниченного максимального правдоподобия. Будут затронуты темы оценки полигенетических рисков и прецизионной медицина, которая уже эффективно внедряется в части оценки персонального риска заболевания раком и стратификации рисков развития болезни Альцгеймера.
Предыдущие лекции курса можно посмотреть здесь.
Генетика — область больших возможностей для машинного обучения. Наиболее репрезентативные полногеномные исследования (GWAS) уже проводятся на выборках, превышающих 1 млн человек, и содержат информацию по десяткам миллионов ассоциаций между геномными вариантами и фенотипическими признаками. По некоторым оценкам, в совокупности эти исследования покрывают 80% вариативности сложных черт человека, в том числе психических расстройств. Несмотря на это, сохраняется трудность перехода от полученного научного знания к клиническим приложениям. На практике персональная генетическая информация крайне редко применяется для прогнозирования заболеваний. В ходе лекции будут рассмотрены наиболее успешные полногеномные исследования и ограничения, которые препятствуют эффективному применению методов машинного обучения в генетике человека. Часть занятия будет посвящена статистической методологии, лежащей в основе подобных исследований, в том числе анализу байесовских смешанных моделей и методу ограниченного максимального правдоподобия. Будут затронуты темы оценки полигенетических рисков и прецизионной медицина, которая уже эффективно внедряется в части оценки персонального риска заболевания раком и стратификации рисков развития болезни Альцгеймера.
Предыдущие лекции курса можно посмотреть здесь.