Исследователи из Массачусетского технологического института в США и института Пастера во Франции разработали математический аппарат, позволяющий проводить обработку целых геномов на обычном персональном компьютере за несколько минут. Это серьёзное достижение – поскольку стандартные технологии сборки геномов рассчитаны на суперкомпьютеры, обрабатывающие один геном за несколько часов.
По словам одного из авторов работы, Бонни Бергер, профессора математики в лаборатории информатики и ИИ при МТИ, новая платформа позволяет быстро собирать целые геномы и метагеномы, на ноутбуках со скромными характеристиками. А это важно, например, в случаях, когда нужно быстро оценить изменения микробиома кишечника в связи с заболеваниями и бактериальными инфекциями, чтобы быстрее отреагировать на них, и, возможно, спасти жизнь пациенту.
Геном человека был расшифрован в начале 2000-х, почти 20 лет назад. С тех пор технологии заметно развились. Но, хотя расшифровка с тех пор стала более точной, на сборку генома целиком до сих пор уходит очень много времени и вычислительных ресурсов.
Один из методов, используемых в бионформатике для сборки геномов и генетических последовательностей связан с «графами де Брёйна». В новом исследовании Бергер с коллегами создали «пространство минимайзеров графа де Брёйна» (mdBG), в котором используются краткие последовательности нуклеотидов – минимайзеры – а не отдельные нуклеотиды.
По словам Бергер, в их mdBG хранится малая доля общего числа нуклеотидов, и при этом сохраняется общая структура генома, из-за чего эта платформа оказывается на несколько порядков эффективнее классических графов де Брёйна.
При проверке платформы команде удалось корректно собрать геном человека за 10 минут на компьютере с 10 Гб памяти. Кроме того, исследователи создали mdBG-репрезентацию 661 405 бактериальных геномов, и успешно найти в этой базе гены, отвечающие за устойчивость к антибиотикам, всего за 12 минут.