Химики проверяют ретросинтетические пути, полностью предсказанные алгоритмами ИИ

Автор оригинала: Katrina Krämer
  • Перевод

Впервые, насколько мне известно, когда компьютерная программа предсказывает синтез и вы идете в лабораторию — бац! — а оно работает
— так описывает свою программу Chematica Бартош Гжибовский.

Предыстория


Идея компьютерного планирования химических синтезов далеко не нова. Элиас Дж. Кори из Гарвардского университета разработал первую версию такой программы (Logic and Heuristics Applied to Synthetic Analysis), в 1970-х годах, но она никогда не оправдала возложенных на нее надежд. Chematica является одним из нескольких новых соперничающих программных продуктов, которые появились за последние пару лет. Бартош Гжибовски (Bartosz Grzybowski, Ульсанский национальный институт науки и техники, Южная Корея и Польская академия наук) работал над программой в течение 15 лет, прежде чем продавать ее MilliporeSigma в мае 2017 года.

Обычно, химики целиком полагаются на свой опыт и знания — химическую интуицию — для разработки последовательности реакций, которая должна приводить к большой молекуле из более маленьких молекул-блоков. Также химики должны учитывать различные ограничения, такие как несовместимость функциональных групп в определенных условиях реакций.


Chematica успешно спрогнозировала пути синтеза восьми синтетически сложных молекул и в ряде случаях смогла улучшить выходы продуктов реакции.

Планировать ретросинтез, согласно Гжибовски, это как играть в шахматы: есть некоторое количество основных ходов. В ходе игры, каждый ход открывает новую ветку для получения уже другого результата. Но в органическом синтезе «количество основных шагов — основные типы реакций — просто огромен». После каждого синтетического хода, возникает выбор из около сотни последующих возможных шагов. Это означает, что чем больше стадий синтеза, тем более впечатляющ набор возможных шагов.

Но химики предвзяты, объясняет Сара Трис (Sarah Trice, руководитель отдела коммерческого развития технологий хеминформатики из MilliporeSigma — компании недавно купившей Chematica), то есть есть тенденция использовать то что было успешным в прошлом. Гжибовский считает, что Chematica устранит предвзятость. Алгоритм Chematica был обучен более чем 50,000 правил в течении последних 15 лет, также как и средства поиска вариантов в этом огромном химическом космосе и разработки нужных последовательностей реакций.

Испытания


Несмотря на привлекательность концепта, не было никаких данных для подтверждения, что он действительно работает. Но теперь Chematica доказала значимость в лабораторных испытаниях. Алгоритм нашел важные пути для восьми молекул: шесть малых биологически активных соединений, один медикамент-блокбастер и одну молекулу природного соединение.

Раннее предложенные пути для большинства из этих шести лекарственных соединений имели проблемы с низким выходом продуктов, а часть из них вообще не была синтезирована. Chematica разработала пути с менее чем 10 синтетическими шагами, используя только обычные реагенты. Тем не менее, команда смогла получить целевые продукты с высокими выходами — в некоторых случаях от 1% до 60% — при этом сэкономив время и деньги на лабораторные исследования, по сравнению с предыдущими попытками.

Некоторые из ретросинтетических расчленений программы были необычными — такие как трехкомпонентная аза-Генри реакция в одном из путей к одному стереоизомеру хинолон-сочлененного лактама. «Химикам было необычно проводить некоторые стадии синтеза, так как их чутье, подсказывало им, что здесь может не получиться», смеется Трис. Гжибовский рассказывает, что «правила игры были такими: вы не можете изменить ретросинтетические расчленения и вам нужно следовать общей методологии».

Ограничения


Так как Chematica не дает точных условий для каждой реакции, все есть необходимость идти путем проб и ошибок, когда дело касается оптимизации синтеза. Однако, для реалистичности время и финансы были ограничены пятью попытками для каждой реакции и максимума в 70 часов для проведения каждого полного синтеза.

Лекарство-блокбастер против аритмии препарат дронедарон (dronedarone) служил примером другой проблемы: его синтез защищен 46-ю патентами.



Chematica сумела спланировать синтез лекарственного препарата дронедарон против антиаритмии, который избегал всех вариантов защищенных патентами. Программа также умеет учитывать стоимость реагентов для производства и выбирать более дешевые пути синтеза.

Ричмонд Сарпонг (Richmond Sarpong, Калифорнийский университет, Беркли) и его научная группа тоже получила шанс протестировать новый инструмент. «Мы были очень впечатлены возможностями. Алгоритм особенно эффективен в поиске решений определенных структурных фрагментов. В этой части нахожу, что программа более способна, по сравнению с человеком».

Тем не менее, Сарпонг указывает, что «как и люди, программа пытается предсказывать с участием архитектурно сложных молекул, где возникают стереоэлектронные тонкости». Группа Сарпонга в настоящее время работает над одним из синтетических путей, предсказанных Chematica.

Гжибовский считает, что следующим этапом будут сложные природные соединения. Его команда завершает 15-ступенчатый синтез недавно выделенного природного алкалоида. «Я никогда не считал себя очень компетентным органических химиком. Это первый полный синтез в моей жизни», — говорит он. «Я считаю, что это действительно способно помочь людям, которые не получили классической подготовки химика-синтетика», — добавляет Трис.

Гжибовский с готовностью отмечает, что Chematica не должна рассматриваться как угроза для опыта химиков. Поскольку алгоритм не может научить себя новым реакциям, «нам все еще нужны смелые химики-органики, готовые бросить вызов таким программам как Chematica и найти нетрадиционные способы создания молекул», — соглашается Мариола Тортоса (химик-органик, специализируется на синтезе природных соединений в университете Мадрида, Испания). «Тем не менее, программа может значительно ускорить [ретроинтеза]», — говорит она.

Джон Максвелл, вице-президент по химии в Tango Therapeutics, считает, что эта статья не доказывает, что Chematica планирует синтезы лучше, чем химики. Он указывает, что химики, синтезы которых выбраны для сравнения, не обязательно оптимизировали синтезы для выхода продукта или длины цепочки реакций.

Часть химиков задается вопросом, как Chematica и MilliporeSigma будут решать вопросы интеллектуальной собственности. Ричмонд Сарпонг, говорит, что исследователи могут не решаться использовать Chematica, так как не ясно, какой доступ будет у компании к молекулам, которые вводят пользователи или кто будет владеть интеллектуальной собственностью синтетических путей, которые генерирует Chematica. Сара Трис, поясняет, что целевые молекулы может видеть только пользователь, и что MilliporeSigma не будет контролировать интеллектуальную собственность вариантов синтеза, предлагаемых Chematica.

Компания уже работает с промышленными и академическими партнерами для тестирования программного обеспечения и надеется выпустить коммерческую версию в конце этого года.

Исходная статья в открытом доступе. 10.1016/j.chempr.2018.02.002

Кому интересно, тут можно прочитать, как планируют ретросинтез.

Видео-пример интерфейса программы


Критика, исправления и предложения приветствуются.
Об ошибках лучше писать в личные сообщения, чтобы не отвлекать людей, которые ищут в комментариях дополнительную информацию или отзывов. Перевод не дословный. Некоторые абзацы сокращены.

  1. В предысторию добавлен абзац из новости https://cen.acs.org/articles/96/i10/Chemists-test-computer-planned-syntheses.html.
  2. Добавлено еще два абзаца с комментариями в конце поста.
  3. Добавил видео.

Поделиться публикацией

Комментарии 27

    +1
    Можно еще упомянуть, что Chematica была куплена Мерком и теперь ее распространене только с разрешения и/или согласования конторы. Может конечно оны выкатят коммерческую версию?!
    Хотя, как мне кажется, ввиду того что эффективность напрямую зависит от размеров БД, все сливки поличит держатель. А может они сделают такой формать БД что модно будет допиливать их самому, под свои спец. задачи…
      0
      Да, точно ведь сигма тоже уже продалась Мерку. Не думал об этом, спасибо.
      Зачем это им? Скорее всего, в разработке таких программ слишком много риска? Для собственной фармы?
      • НЛО прилетело и опубликовало эту надпись здесь
      +1
      ИМХО, это прекрасно.

      Во многих областях науки и техники количество знаний, чтобы стать специалистом превышает возможности одного человека, в результате все углубляются в специализации.

      ИИ и подобные программы — это шанс человечества на то, чтобы люди в процессе своей научной деятельности, могли дополнять программу, а программа, обладая суммарным опытом человечества, позволяла находить решения.
        +1
        Лишь бы грустного не произошло — ИИ уперся в тупик, а люди уже настолько к нему привыкли, что поверили и больше не изобретают сами.
        Это, кстати, не только для этой области характерно. В общем случае мы учим ИИ на предыдущем опыте, ИИ рождает что-то похожее на предыдущее, а кардинально новое не появляется. Ну это так, страшилка из размышлений о ИИ. Фильм про это не снимут, а подумать стоит.
          +1

          Судя по шахматам и го — это не так. Новое рождается

            0
            Что по вашему есть «кардинально новое»? И есть ли хоть один пример «кардинально нового» без опоры на предыдущий опыт?
              0
              HAL 9000: компьютеры не могут ошибаться. Причина ошибки всегда человек.
                0
                мы учим ИИ на предыдущем опыте, ИИ рождает что-то похожее на предыдущее, а кардинально новое не появляется
                Мы все учимся только на предыдущем опыте, потому что какого-то иного опыта у нас с вами нет. Если бы это исключало возможность создавать новое, то ничто в мире не было бы создано, за исключением того, что было создано по воле случая.
                  0
                  Окей. Есть что-либо подобное фреймворкам в любом отличном от разработки ПО мире?

                  Приведу примеры:
                  В киноиндустрии есть готовые программы монтажа, для создания простых эффектов с полпинка, сложных — с некоторым напряжением.

                  В бизнесе — складском учете, есть готовые продукты (типа MS Динамикс, типа 1С), представляющие фреймворки или платформы для быстрого создания нужного продукта.

                  А что еще есть в науке, кроме Вольфрам-альфа для математики и IBM-омвского ИИ который ставит диагнозы?
                    0
                    Фильм не снимут, а вот книга уже давно есть. Забыл автора (кто-то из классиков). Правда, там загружали всю базу знаний и умений в человека. Но были такие, кто не мог обучиться (более подробно про это писать — только спойлерить) и обучались старыми методами, по книгам. Собственно, в книге описывается от лица человека, кто выпал из этой системы всеобщего обучения и что из этого вышло.
                      0
                        0
                        Подозреваю, что речь идет о «Ловушка для простаков», где в далеком будущем профессионал своего дела был очень хорошим профессионалом, но из-за издержек профессионального обучения, каждый профессионал оказался нишевым специалистом, в результате на стыке наук не осталось никого. Кроме мнемонической службы.
                          0
                          Ловушку я не помню, но Профессию перечитывал недавно — совпадение 100% с комментарием green_worm.
                          Согласно вики у Азимова есть несколько рассказов про «овер-специализацию»:
                          Like other short stories by Asimov such as The Dead Past and Profession, the theme of Sucker Bait is the peril of scientific overspecialization.

                          Может быть, они действительно очень похожие, не знаю.
                            0
                            Точно! Профессия Азимова! =)
                  +2
                  И теперь синтез дронедарона будет защищён 47-ю патентами…
                    0
                    Теперь те кто производят по схеме защищенной 46-ю патентами будут конкурировать с теми кто производит по схеме с 47-ю.
                      0
                      Хуже. Теперь компания-владелец такой программы будет защищать синтезы своих препаратов таким количеством схем, что альтернативы этим синтезам уже не найдёшь.
                      +1
                      Хм… еще больше способов сварить мет на кухне… теперь вообще из любого дерьма.
                        0
                        Природный алкалоид говорите?
                          +1
                          Где скачать пиратку?
                            0
                            Скоро на самом популярном заблокированном торрент-трекере. Но я буду ждать BDRip.
                          0
                          Эта программа пригодится в опытах по созданию наноассемблера.
                            0
                            Очень интересная разработка. Пусть только мой тест пройдёт сначала: спроектирует цепочку синтеза бензойной кислоты из угля и бокситов. Ну, ладно, разрешаю ещё бром применять как один из исходных реагентов.
                              +1
                              Эм… Скорее всего, программа выдаст ответ решением «в лоб»: улавливание бензола из коксового газа при коксовании, бензол в толуол (Фриделем-Крафтсем) и дальше окисление чем больше нравится.
                              А бокситы… ну хз… можно вроде как восстанавливать коксом, не? =)
                                0
                                Бокситы (оксид алюминия, по сути) спекаются с углём — получается карбид алюминия. Карбид алюминия разлагается водой до метана. Метан дегидрируется до ацетилена. Из ацетилена очень легко тримеризацией получается бензол. Это первый полупродукт. Далее, снова берём метан, бромируем его. Возвращаемся к бензолу, синтезируем из него и бромметана толуол по Фриделю-Крафтсу. Ну, и окислить толуол до бензойной кислоты. А можно ответвиться на этапе бензола, получить бромбензол, а затем карбоксилировать его по Гриньяру, получив необходимый для этого углекислый газ сжиганием метана =) Ну, если подумать, там ещё вариантов можно наскрести.
                              0
                              Интересно, почему до сих пор нет десятка альтернативных программ? Вроде как моделирование молекул на квантовом уровне уже давно решенная задача, даже живую клетку смоделировали по отдельным атомам. В чем же загвоздка?

                              Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                              Самое читаемое