Каждый год в конце июля Институт биоинформатики совместно с СПбАУ РАН проводит летнюю школу по биоинформатике. В этой небольшой статье собраны лекции (видео и слайды) за два последних года проведения летних школ.
Каждый год на школу приезжает 100 студентов и аспирантов со всей России, СНГ и других стран. В основном это биологи, медики, программисты, математики и физики. В течение недели участники погружаются в мир биоинформатики:просыпают посещают лекции и семинары, много общаются друг с другом и работают над научными проектами.
Лекции на школе читают ведущие российские и зарубежные ученые, а также исследователи из биотехнологических и биоинформатических компаний.
В этой статье собраны лекции за два года проведения летних школ. Некоторые лекции будут понятны без дополнительной подготовки (отмечены звёздочкой «*»). Другие рассчитаны на тех, кто имеет некоторое представление о молекулярной биологии и программировании. Для удобства лекции разделены по пяти темам. Также в скором времени (отдельным постом) появятся лекции по статистике, иммунологии и метагеномике.
В 2016 году школу поддерживали компании JetBrains, РВК, BIOCAD, EPAM Systems и Parseq Lab. За что им большое спасибо.
Если вы хотите принять участие в летней школе 2017 — заполните форму на сайте школы, и мы сообщим вам, как только откроется прием заявок.
1. Технологии секвенирования* (Павел Добрынин, Центр геномной биоинформатики им. Ф.Г. Добржанского, СПбГУ)
Видео | Слайды
Обзорная лекция о становлении и развитии технологий секвенирования: применение NGS для решения различного рода задач, сильные и слабые стороны существующих методов, а также ограничения их использования. Перспективы развития технологий секвенирования.
2. Практическая биоинформатика: обработка данных NGS (Александр Предеус, Институт биоинформатики)
Видео | Слайды
В лекции рассматриваются основные области, в которых работают биоинформатики в науке и индустрии. Подавляющее большинство задач биоинформатиков можно разделить на две большие категории: обработка экспериментов и предсказание каких-либо свойств биологической системы. В лекции подробно освещены задачи первой категории, а точнее — обработка NGS-экспериментов, взаимодействие с экспериментаторами в вашей лаборатории и контроль качества.
3. Транскриптомика: практические методы и применяемые алгоритмы (Александр Предеус, Институт биоинформатики)
Видео | Слайды
Транскриптомика уверенно заняла место в списке самых популярных задач, встающих перед NGS-биоинформатиками. Дифференциальный анализ экспрессии генов, кластеризация экспрессионных данных и интерпретация полученных данных в терминах метаболических и сигнальных каскадов позволяют получить богатейшую информацию практически о любой системе. В лекции рассматриваются лучшие пайплайны, основные проблемные места в дизайне экспериментов и обработке, а также практические случаи удачного применения транскриптомных подходов.
4. Практическое применение ChIP-Seq и родственных методов (Александр Предеус, Институт биоинформатики)
Видео | Слайды
Методы ChIP-Seq, а также «геномного футпринтинга» (ATAC-Seq, FAIRE-Seq, DNase-Seq) широко применяются для нахождения механизмов регуляции биологических процессов, в частности, транскрипционной регуляции. Потенциальное пространство изучаемых факторов очень многомерно, однако селективный подход позволяет получить богатую информацию о регуляции в системе на основании всего нескольких экспериментов. В лекции рассказывается о таких подходах. На примере конфликтующих современных теорий показаны основные сложности интерпретации регуляторной информации и способы консолидации полученных результатов.
5. Применение HTS в поиске первопричин раковых заболеваний (Константин Оконечников, German Cancer Research Center, DKFZ)
Видео | Слайды
Технологии высокопроизводительного секвенирования (HTS) стали одними из наиболее важных и часто применяемых методов в молекулярной биологии. Несмотря на то, что анализ результатов HTS является сложной задачей, существует ряд методов и инструментов, позволяющих обрабатывать эти данные биологам и медикам без специальной биоинформатической подготовки. В этой лекции рассказывается о том, как на практике можно использовать эти методы и программы.
6. Полногеномное секвенирование при анализе траекторий детского развития (Елена Григоренко, СПбГУ, Baylor College of Medicine, Yale University, University of Houston)
Видео | Слайды
В лекции приводятся примеры использования разных типов полногеномного секвенирования в контексте изучения типичных (нейротипичных) и нетипичных (нейронетипичных) траекторий развития. Применение данных секвенирования экзома, метилома и генома для анализа расстройств развития (например, расстройств языка и речи, расстройства поведения и расстройств аутистического спектра).
7. Аннотация MPS данных таргетной панели для диагностики моногенных заболеваний (Тамара Симакова, Parseq Lab)
Видео | Слайды
Высокопроизводительное секвенирование позволяет получать данные высокого качества о последовательности нуклеотидов в геноме. Для применения результатов анализа в клинической практике необходимо корректно определить генетические варианты, провести их аннотацию и интерпретацию в контексте исследуемого заболевания и направляющего диагноза. Данный этап по-прежнему остается сложной задачей, имеющей ключевое значение для эффективного использования новой технологии.
8. Сборка генома в исторической перспективе* (Михаил Колмогоров, University California San Diego)
Видео | Слайды
Задача сборки генома — одна из самых старых задач биоинформатики — остается актуальной и на сегодняшний день. Различные алгоритмы и модели быстро сменяют друг друга, поспевая за развивающимися биотехнологиями и наращиванием вычислительных мощностей. В лекции рассказывается история этой задачи — начиная от первой сборки генома человека и заканчивая последними успехами в области.
9. Сборка de novo геномов и транскриптомов (Артем Касьянов, МФТИ, ИОГен РАН)
Видео | Слайды
Развитие технологий высокопроизводительного секвенирования привело к значительному упрощению секвенирования и сборки de novo нуклеотидных последовательностей немодельных видов. Cборка геномных и транскриптомных последовательностей постепенно становится рутинной процедурой. Однако большинство геномных нуклеотидных последовательностей, полученных с использованием NGS, представлено в базах данных в виде незаконченных черновиков геномов.
10. Референсный геном в виде графа как «геномный паспорт» человечества (Марина Зуева, EPAM Systems)
Видео | Слайды
Одним из величайших достижений человечества стала расшифровка генома человека в 2003 году. С тех было секвенировано более 250 000 тысяч человек, и это число удваивается каждый год. Гаплоидный геном не позволяет адекватно отразить весь объем быстрорастущей информации, выходом является референс в виде графа, построенного таким образом, чтобы геном каждого человека мог быть представлен в виде пути в этом графе.
Отражение геномной информации в единой структуре данных — серьезный научный вызов. Решение данной задачи принесет плоды в различных областях современной биоинформатики, но прежде всего в популяционной генетике и поиске новых мутаций.
11. Молекулярная биология и эволюция* (Надежда Маркина, ИБХ РАН)
Видео | Слайды
Вводная лекция по основам молекулярной биологии и эволюции для информатиков и программистов. Лекция дает шанс овладеть основными понятиями, которые потребуются при дальнейшем освоении биоинформатики в целом.
12. Основы популяционной генетики* (Михаил Колмогоров, UCSD)
Видео | Слайды
Популяционная генетика изучает изменчивость организмов внутри одной популяции. Характер и динамика наблюдаемых мутаций играют важную роль в понимании развития организма. В лекции описаны основные понятия и математические модели, используемые в популяционной генетике, а также применение этих моделей в реальных исследованиях.
13. Эволюция бактериальных геномов (Михаил Гельфанд, МГУ, ИППИ РАН)
Видео
Бактериальный геном можно рассматривать на разных уровнях: как набор генов
(и обсуждать эволюцию пан-геномов), как последовательность генов (и обсуждать геномные перестройки) и как последовательность нуклеотидов (и обсуждать гомологичную рекомбинацию). В лекции приводятся разные примеры и обсуждаются перспективы общей теории.
14. Эволюция регуляторных систем (Михаил Гельфанд, МГУ, ИППИ РАН)
Видео
Эволюция бактериальных регуляторных систем включает изменение состава регулонов, перестройку регуляторных каскадов и ко-эволюцию факторов транскрипции и узнаваемых ими мотивов в ДНК. В лекции приводятся разные примеры и перспективы этой теории.
15. Последние достижения в анализе эволюционных перестроек (Максим Алексеев, George Washington University)
Видео | Слайды
Эта лекция посвящена последним научным достижениям в области анализа эволюционных перестроек. Геномные перестройки — это, образно говоря, геномные «землетрясения», которые изменяют структуру хромосом. Минимальное количество перестроек между двумя геномами (так называемое «геномного расстояние») представляет собой достаточно точную меру эволюционного расстояния между этими организмами и часто используется в сравнительной геномике. Несмотря на то, что существует удобная модель Double-Cut-and-Join (DCJ) для анализа наиболее распространенных перестроек генома (развороты, транслокации, деления, слияния) и вычисления соответствующего расстояния, эта модель совсем не учитывает более редкие, но «мощные" транспозиции перегруппировки.
16. Почему люди стареют и как биоинформатика помогает в этом разобраться?* (Андрей Афанасьев, CEO компании iBinom, с.н.с. Лаборатории функционального анализа генома МФТИ)
Видео | Слайды
Обзорная лекция о достижениях современной геронтологии, проблемах и перспективных направлениях.
17. Тайны старения мозга (Елена Сюгис, Quretec, University of Tartu)
Видео | Слайды
Значимая часть современных исследований направлена на изучение молекулярных механизмов старения мозга и возникновения нейродегенеративных заболеваний, таких как болезнь Паркинсона и болезнь Альцгеймера. Результаты таких экспериментов накапливаются в различных общедоступных и частных базах данных, которые создаются для эффективной работы с определенными типами биологических данных. Тем не менее, основные механизмы нейродегенеративных заболеваний все еще остаются плохо изученными. В данной лекции обсуждается создание общих сложных сетей взаимодействия отдельных уже описанных механизмов для создания целостной картины в понимании нейродегенеративных поражений.
18. Мировые генетические и биоинформатические компании. И те, кто ими притворяется*(Андрей Афанасьев, CEO компании iBinom, с.н.с. Лаборатории функционального анализа генома МФТИ)
Видео | Слайды
Обзор мирового рынка биоинформатики и NGS. Тренды и ведущие игроки.
А также пара слов о том, как работает венчурная индустрия, и почему появляются Элизабет Перриш и ей подобные.
19. What's hot: о чем говорят врачи с биоинформатиками на международных конференциях* (Андрей Афанасьев, CEO компании iBinom, с.н.с. Лаборатории функционального анализа генома МФТИ)
Видео | Слайды
Обзор выступлений на научно-практических конференциях TRI-Con, ASHG, AMP и NGS в медицинской генетике. Основные вопросы современной медицинской генетики и молекулярной диагностики.
20. Современные методы разработки таргетных лекарственных средств (Павел Яковлев, директор департамента вычислительной биологии, BIOCAD)
Видео | Слайды
Лекция посвящена общим вопросам и тенденции современной разработки лекарств на примере биоинформацевтической компании BIOCAD.
Вводные слова о школе
Каждый год на школу приезжает 100 студентов и аспирантов со всей России, СНГ и других стран. В основном это биологи, медики, программисты, математики и физики. В течение недели участники погружаются в мир биоинформатики:
Лекции на школе читают ведущие российские и зарубежные ученые, а также исследователи из биотехнологических и биоинформатических компаний.
В этой статье собраны лекции за два года проведения летних школ. Некоторые лекции будут понятны без дополнительной подготовки (отмечены звёздочкой «*»). Другие рассчитаны на тех, кто имеет некоторое представление о молекулярной биологии и программировании. Для удобства лекции разделены по пяти темам. Также в скором времени (отдельным постом) появятся лекции по статистике, иммунологии и метагеномике.
В 2016 году школу поддерживали компании JetBrains, РВК, BIOCAD, EPAM Systems и Parseq Lab. За что им большое спасибо.
Если вы хотите принять участие в летней школе 2017 — заполните форму на сайте школы, и мы сообщим вам, как только откроется прием заявок.
Технологии высокопроизводительного секвенирования (NGS), обработка их данных и применение результатов в медицинской и научной практике
1. Технологии секвенирования* (Павел Добрынин, Центр геномной биоинформатики им. Ф.Г. Добржанского, СПбГУ)
Видео | Слайды
Обзорная лекция о становлении и развитии технологий секвенирования: применение NGS для решения различного рода задач, сильные и слабые стороны существующих методов, а также ограничения их использования. Перспективы развития технологий секвенирования.
2. Практическая биоинформатика: обработка данных NGS (Александр Предеус, Институт биоинформатики)
Видео | Слайды
В лекции рассматриваются основные области, в которых работают биоинформатики в науке и индустрии. Подавляющее большинство задач биоинформатиков можно разделить на две большие категории: обработка экспериментов и предсказание каких-либо свойств биологической системы. В лекции подробно освещены задачи первой категории, а точнее — обработка NGS-экспериментов, взаимодействие с экспериментаторами в вашей лаборатории и контроль качества.
3. Транскриптомика: практические методы и применяемые алгоритмы (Александр Предеус, Институт биоинформатики)
Видео | Слайды
Транскриптомика уверенно заняла место в списке самых популярных задач, встающих перед NGS-биоинформатиками. Дифференциальный анализ экспрессии генов, кластеризация экспрессионных данных и интерпретация полученных данных в терминах метаболических и сигнальных каскадов позволяют получить богатейшую информацию практически о любой системе. В лекции рассматриваются лучшие пайплайны, основные проблемные места в дизайне экспериментов и обработке, а также практические случаи удачного применения транскриптомных подходов.
4. Практическое применение ChIP-Seq и родственных методов (Александр Предеус, Институт биоинформатики)
Видео | Слайды
Методы ChIP-Seq, а также «геномного футпринтинга» (ATAC-Seq, FAIRE-Seq, DNase-Seq) широко применяются для нахождения механизмов регуляции биологических процессов, в частности, транскрипционной регуляции. Потенциальное пространство изучаемых факторов очень многомерно, однако селективный подход позволяет получить богатую информацию о регуляции в системе на основании всего нескольких экспериментов. В лекции рассказывается о таких подходах. На примере конфликтующих современных теорий показаны основные сложности интерпретации регуляторной информации и способы консолидации полученных результатов.
5. Применение HTS в поиске первопричин раковых заболеваний (Константин Оконечников, German Cancer Research Center, DKFZ)
Видео | Слайды
Технологии высокопроизводительного секвенирования (HTS) стали одними из наиболее важных и часто применяемых методов в молекулярной биологии. Несмотря на то, что анализ результатов HTS является сложной задачей, существует ряд методов и инструментов, позволяющих обрабатывать эти данные биологам и медикам без специальной биоинформатической подготовки. В этой лекции рассказывается о том, как на практике можно использовать эти методы и программы.
6. Полногеномное секвенирование при анализе траекторий детского развития (Елена Григоренко, СПбГУ, Baylor College of Medicine, Yale University, University of Houston)
Видео | Слайды
В лекции приводятся примеры использования разных типов полногеномного секвенирования в контексте изучения типичных (нейротипичных) и нетипичных (нейронетипичных) траекторий развития. Применение данных секвенирования экзома, метилома и генома для анализа расстройств развития (например, расстройств языка и речи, расстройства поведения и расстройств аутистического спектра).
7. Аннотация MPS данных таргетной панели для диагностики моногенных заболеваний (Тамара Симакова, Parseq Lab)
Видео | Слайды
Высокопроизводительное секвенирование позволяет получать данные высокого качества о последовательности нуклеотидов в геноме. Для применения результатов анализа в клинической практике необходимо корректно определить генетические варианты, провести их аннотацию и интерпретацию в контексте исследуемого заболевания и направляющего диагноза. Данный этап по-прежнему остается сложной задачей, имеющей ключевое значение для эффективного использования новой технологии.
Сборка геномов
8. Сборка генома в исторической перспективе* (Михаил Колмогоров, University California San Diego)
Видео | Слайды
Задача сборки генома — одна из самых старых задач биоинформатики — остается актуальной и на сегодняшний день. Различные алгоритмы и модели быстро сменяют друг друга, поспевая за развивающимися биотехнологиями и наращиванием вычислительных мощностей. В лекции рассказывается история этой задачи — начиная от первой сборки генома человека и заканчивая последними успехами в области.
9. Сборка de novo геномов и транскриптомов (Артем Касьянов, МФТИ, ИОГен РАН)
Видео | Слайды
Развитие технологий высокопроизводительного секвенирования привело к значительному упрощению секвенирования и сборки de novo нуклеотидных последовательностей немодельных видов. Cборка геномных и транскриптомных последовательностей постепенно становится рутинной процедурой. Однако большинство геномных нуклеотидных последовательностей, полученных с использованием NGS, представлено в базах данных в виде незаконченных черновиков геномов.
10. Референсный геном в виде графа как «геномный паспорт» человечества (Марина Зуева, EPAM Systems)
Видео | Слайды
Одним из величайших достижений человечества стала расшифровка генома человека в 2003 году. С тех было секвенировано более 250 000 тысяч человек, и это число удваивается каждый год. Гаплоидный геном не позволяет адекватно отразить весь объем быстрорастущей информации, выходом является референс в виде графа, построенного таким образом, чтобы геном каждого человека мог быть представлен в виде пути в этом графе.
Отражение геномной информации в единой структуре данных — серьезный научный вызов. Решение данной задачи принесет плоды в различных областях современной биоинформатики, но прежде всего в популяционной генетике и поиске новых мутаций.
Биоинформатика в популяционной и эволюционной генетике
11. Молекулярная биология и эволюция* (Надежда Маркина, ИБХ РАН)
Видео | Слайды
Вводная лекция по основам молекулярной биологии и эволюции для информатиков и программистов. Лекция дает шанс овладеть основными понятиями, которые потребуются при дальнейшем освоении биоинформатики в целом.
12. Основы популяционной генетики* (Михаил Колмогоров, UCSD)
Видео | Слайды
Популяционная генетика изучает изменчивость организмов внутри одной популяции. Характер и динамика наблюдаемых мутаций играют важную роль в понимании развития организма. В лекции описаны основные понятия и математические модели, используемые в популяционной генетике, а также применение этих моделей в реальных исследованиях.
13. Эволюция бактериальных геномов (Михаил Гельфанд, МГУ, ИППИ РАН)
Видео
Бактериальный геном можно рассматривать на разных уровнях: как набор генов
(и обсуждать эволюцию пан-геномов), как последовательность генов (и обсуждать геномные перестройки) и как последовательность нуклеотидов (и обсуждать гомологичную рекомбинацию). В лекции приводятся разные примеры и обсуждаются перспективы общей теории.
14. Эволюция регуляторных систем (Михаил Гельфанд, МГУ, ИППИ РАН)
Видео
Эволюция бактериальных регуляторных систем включает изменение состава регулонов, перестройку регуляторных каскадов и ко-эволюцию факторов транскрипции и узнаваемых ими мотивов в ДНК. В лекции приводятся разные примеры и перспективы этой теории.
15. Последние достижения в анализе эволюционных перестроек (Максим Алексеев, George Washington University)
Видео | Слайды
Эта лекция посвящена последним научным достижениям в области анализа эволюционных перестроек. Геномные перестройки — это, образно говоря, геномные «землетрясения», которые изменяют структуру хромосом. Минимальное количество перестроек между двумя геномами (так называемое «геномного расстояние») представляет собой достаточно точную меру эволюционного расстояния между этими организмами и часто используется в сравнительной геномике. Несмотря на то, что существует удобная модель Double-Cut-and-Join (DCJ) для анализа наиболее распространенных перестроек генома (развороты, транслокации, деления, слияния) и вычисления соответствующего расстояния, эта модель совсем не учитывает более редкие, но «мощные" транспозиции перегруппировки.
Биоинформатика и старение
16. Почему люди стареют и как биоинформатика помогает в этом разобраться?* (Андрей Афанасьев, CEO компании iBinom, с.н.с. Лаборатории функционального анализа генома МФТИ)
Видео | Слайды
Обзорная лекция о достижениях современной геронтологии, проблемах и перспективных направлениях.
17. Тайны старения мозга (Елена Сюгис, Quretec, University of Tartu)
Видео | Слайды
Значимая часть современных исследований направлена на изучение молекулярных механизмов старения мозга и возникновения нейродегенеративных заболеваний, таких как болезнь Паркинсона и болезнь Альцгеймера. Результаты таких экспериментов накапливаются в различных общедоступных и частных базах данных, которые создаются для эффективной работы с определенными типами биологических данных. Тем не менее, основные механизмы нейродегенеративных заболеваний все еще остаются плохо изученными. В данной лекции обсуждается создание общих сложных сетей взаимодействия отдельных уже описанных механизмов для создания целостной картины в понимании нейродегенеративных поражений.
Современный биоинформатический и биотехнологический рынок
18. Мировые генетические и биоинформатические компании. И те, кто ими притворяется*(Андрей Афанасьев, CEO компании iBinom, с.н.с. Лаборатории функционального анализа генома МФТИ)
Видео | Слайды
Обзор мирового рынка биоинформатики и NGS. Тренды и ведущие игроки.
А также пара слов о том, как работает венчурная индустрия, и почему появляются Элизабет Перриш и ей подобные.
19. What's hot: о чем говорят врачи с биоинформатиками на международных конференциях* (Андрей Афанасьев, CEO компании iBinom, с.н.с. Лаборатории функционального анализа генома МФТИ)
Видео | Слайды
Обзор выступлений на научно-практических конференциях TRI-Con, ASHG, AMP и NGS в медицинской генетике. Основные вопросы современной медицинской генетики и молекулярной диагностики.
20. Современные методы разработки таргетных лекарственных средств (Павел Яковлев, директор департамента вычислительной биологии, BIOCAD)
Видео | Слайды
Лекция посвящена общим вопросам и тенденции современной разработки лекарств на примере биоинформацевтической компании BIOCAD.