— Алексей, здравствуйте! Расскажите, как вы попали в биоинформатику?
— В биоинформатику я попал, будучи студентом медицинского вуза. У меня был достаточно большой опыт программирования до этого, но в чисто таких развлекательных целях.
Преподаватель пригласил в институт медицинской генетики, там была задача обработки данных метилирования — разобраться с пакетом WGCNA для того, чтобы выделять кластеры кометилированных генов. Я за несколько дней освоил, как запускать этот пакет и как с ним работать. Мы подготовили публикации. Так, потихоньку, начиная с простых задач обработки NGS-секвенирования митохондрий, я нарабатывал все больше и больше практического опыта в самых разных задачах, разных отраслях.
— Алексей, скажите, пожалуйста, в какой области вы сейчас работаете и почему?
— Основная область, в которой я работаю, — это генетика и эпигенетика человека чаще всего в связи с различными болезнями. Очень много работаю над многофакторными патологиями, например, сердечно-сосудистыми заболеваниями, аневризмом аорты. Мы изучаем как генетические, так и эпигенетические компоненты: метилирование ДНК, экспрессию микроРНК. Помимо этого, я также занимаюсь популяционной генетикой, эволюционной генетикой, ДНК-идентификацией человека, медицинской генетикой.
В нашем институте есть генетическая клиника, где наблюдаются пациенты, которым проводится диагностика методами NGS. Я участвую в обработке этих данных для последующей интерпретации вариантов, которые обнаруживаются у пациентов.
Вообще, у меня основная область — это человек во всех его проявлениях. Изредка попадаются метагеномные исследования, но тоже связанные с человеком, а именно с различными патогенами людей.
— Какие шаги, по вашему мнению, являются ключевыми для того, чтобы стать биоинформатиком и найти работу?
— Биоинформатика для меня — это инструментарий, очень полезный инструментарий. Хороший биоинформатик должен знать не только конкретный инструмент, но и иметь широкий кругозор, чтобы понимать, какой инструмент и в какой момент времени предпочтительнее использовать.
Основным шагом для того, чтобы стать биоинформатиком и вообще начать свой путь в этой сфере — это найти ту задачу, к которой нужно прикладывать эти знания. Без точки приложения очень сложно будет развиваться, потому как только в практике, в опыте, ты приобретаешь необходимые навыки и узнаешь особенности проведения конкретных экспериментов.
— С какими вызовами сталкивается биоинформатик в реальной практике?
— Я сразу хотел предостеречь будущих коллег от формального отношения к биоинформатике как к набору сухих инструкций и алгоритмов. Иногда более глубокий анализ может принести к совершенно неожиданным результатам.
Самое сложное в работе биоинформатика — это коммуникация с теми, кто проводит анализ до и интерпретирует данные после. Однажды к нам приходит запрос на обработку данных РНК-секвенирования. Ничего сверхестественного: простая дифэкспрессия между группами. Но к середине обработке я замечаю, что имеют место небольшие артефакты. Покрытие вроде нормальное, уровень экспресии нормальный, но генов не так много. Обращаюсь к коллегам, а мне между делом говорят, что это не человеческая культура, а мышиная! Теперь я всегда переспрашиваю, что за объект мне принесли. И перед обработкой как РНК, так и ДНК-секвенирования у меня всегда стоит простенький, но метагеномный анализ, чтобы выявлять контаминацию: микробную или другими видами.
Еще одна история про то, насколько вы можете доверять образцам, которые собираете не вы. Наши коллабораторы, популяционные генетики, собрали образцы крови. Чисто для контроля качества мы рассчитали коэффициент родства между образцами. И неожиданно было обнаружено 3 клона! Проведение небольшого технического расследования показало, что в трех пробирках была кровь одного и того же человека. По-видимому, медсестра по каким-то причинам не смогла взять образцы у двух людей и просто разлила кровь из первой пробирки в две другие.
Поэтому без знания мокрой части какого-то эксперимента порой ученому-биоинформатику очень нелегко. Не представляя, что физически происходило до того, как ваши данные были получены, сложно понять, а есть ли в них ошибка и на каком этапе она произошла.
— Какие ваши пожелания начинающим изучать «сухую» биологию, а также BigData в биологии и медицине?
— Биоинформатика очень разнообразна, в ней много отраслей, направлений, которые друг от друга могут очень сильно отличаться, требовать разных компетенций. Где-то требуется больше hardskills по программированию, где-то нужно больше общения и понимания задачи, где-то необходимо углубляться в описание экспериментальной работы, понимать больше мокрую часть. Поэтому основным пожеланием будет найти ту отрасль, которая вам интересна, и отыскать в рамках этой отрасли задачу по душе, чтобы можно было дальше развиваться.