Pull to refresh

Comments 21

А ссылки на программы, что бы попробовать есть?
Вы про какие конкретно программы? Здесь речь была только о перспективах. Эта статья — интервью по мотивам обзорной статьи про перспективы ИИ в химии, которую опубликовал Игорь Баскин с коллегами. Если про разработки упомянутых групп, то лучше походить по ссылкам.
Ну программы типа. Цепляешь на бензольное кольцо заместители(амино, хлор, йод, метил, нитро,...) а потом ацилируеш, алкилируешь, формилируешь,… замешенный бензол разными реагентами и смотришь какие примерно выходы, ориентации в результате получаются.
В таком (удобном/готовом для пользователя) виде свободных программ с машинным обучением я не видел. Лучшее, что нашел cdb.ics.uci.edu. Вот здесь исследователи из IBM Research обещают запустить предсказатель в 2018 году.
Несмотря на то, что ИИ в предсказании реакций — сейчас очень популярная тема с очень большим количеством опубликованных работ (часто есть исходники на гитхабе), не так много желающих открывать разработки для широкого использования.
Теоретически лидер в предсказании реакций — Chematica, но так как это коммерческий продукт, проверить возможности не получится.
В этой области практически отсутствуют хорошие open-source программы из-за слишком большого коммерческого потенциала разработок. Более того, до этого года не существовало ни одной свободно-доступной базы данных по реакциям, поэтому построение серьезных моделей возможно сейчас только в рамках соглашений с крупными фирмами — держателями баз. Доступ к некоторым из разработок через Web иногда предоставляется в качестве рекламы.

Доступна для скачивания лишь одна база данных в 1 миллион реакций, построенная путем text mining американских патентов и потому содержащая много ошибок и весьма специфическая. Однако ее уже использует для построения моделей.

figshare.com/articles/Chemical_reactions_from_US_patents_1976-Sep2016_/5104873

Добавлю, что с практической точки зрения уже удалось добиться кое-каких результатов. Insilico с помощью нейросети анализировали химические соединения метформина и рапамицина. Им удалось найти натуральные миметики этих препаратов — аллантоин, гинсеносид, галлат эпигаллокатехина, изоликвиритигенин и витаферин А. Все эти вещества есть в доступных растениях. Insilico по этим данным сделали быстро свой БАД, но ничто не мешает поесть натуральной травы хоть бесплатно.

Преимущества такого решения:
— натуральные травы не имеют таких побочек как лекарства
— натуральные вещества стоят копейки (рапамицин вроде от 40 000 руб и выше)

Конечно, это пока не совсем то, что нам надо, но уже успешный кейс. В ближайшие несколько лет нейросети смогут переизобрести фармакологию.
— натуральные травы не имеют таких побочек как лекарства

Вы про сравнение каких-то «конкретных растений» с метформином и рапамицином? Если нет звучит бредово. Отравиться натуральными травами очень даже реально. В растениях тысячи различных соединений, далеко не все из и них будут действовать положительно на организм. Аллергические реакции, также не стоит забывать. Впрочем, сравнение бадов с лекарствами порадовало. Аллантоин и прочие «миметики» можно купить, зачем использовать растения? Можно ссылку на исследования?
Это по данным Insilico, я не проверял. Нужно им написать конечно, узнать.
Спасибо. Вроде выглядит серьезно. Нашел публикации, почитаю на досуге.
Никаких доказательств эффективности своих препаратов Инсилико не предоставила.

При всем уважении к insilico, но реальной доказательной базы для их находок нет. Второе — отравиться травами очень легко. Три — цена некоторых трав может быть очень высокий.

Товарищи, возможно ли использовать машинное обучение для написания оценочных функций в молекулярных кристаллах? Допустим есть база кристаллических структур Кембриджская, по ней обучить сеть, которая создаст универсальную функцию энергии кристаллической решетки или нечто подобное? Такой своего рода qsar, но только в пространстве и в кристалле.
Да, такие работы имеются (например, onlinelibrary.wiley.com/doi/10.1002/minf.201600162/abstract), но все они относятся не к молекулярным кристаллам, а к кристаллам неорганических соединений (солей, оксидов, металлов). Кэмбринджская база для этого не очень годится, поскольку (1) в ней содержатся только молекулярные кристаллы органических и элементоорганических соединений, (2) в ней отсутствует информация о свойствах для моделирования, (3) она является коммерческой. Аппроксимировать функцию энергии кристаллической решетки молекулярных кристаллов можно либо при помощи стандатрных потенциалов межмолекулярного взаимодействия, либо при помощи потенциалов, найденных с помощью методов машинного обучения на основании данных квантовохимических расчетов высокого уровня для пар молекуд.
А есть формальные языки для химии? Такие что по ним можно было бы автоматически сгенерировать программу для лабораторного робота, или задание на моделирование на суперкомпьютере?
Есть, и довольно много: CML (Chemical Markup Language) — для описания молекул, реакций, спектров, кристаллов и результатов квантово-химических расчетов, SMILES — для описания химических структура, SMIRKS — для описания химических трансформаций, SMARTS — для описания структырных фрагментов, MQL (Molecular Query Language) — для задания запросов к базам данных (химический SQL), PLM — для описания полимерных материалов, и много других.
Все это не совсем то, что я имею в виду. Нужно что-то типа «взять 200 мл водного 95% раствора азотной кислоты, нагреть до 38 градусов, долить 400 грамм глицерина...». То есть это должно понятным образом транслироваться в инстукции лабораторного робота.
Я подобного языка не нашел.
Это уже лабораторная методика синтеза. Формального языка для описания этого действительно не существует.
Скорее всего таких программ в opensource и общем доступе не будет. Для правительства это довольно опасное знание. Приготовление ВВ, наркотиков, ядов и многого другого. При этом из очень доступных материалов, если можно будет задавать больше чем один шаг реакции.
Т.е. я хочу получить то-то то-то. Можно сделать до 5ти шагов. Из исходников есть вот такой-то список веществ. Нельзя использовать реакции с температурой больше 300 градусов и давлением больше 10 атмосфер.
Я бы не сказал что это опасно для правительств. Это страшно опасно для коммерческих производителей. Так как позволяет другим предприятиям относительно легко узнать как сделать новые вещества(но узнать не значить наладить производство). Информации как сделать то что вы перечислили валом в открытом доступе и данная программа не повлияет на производство данных веществ терористами и преступниками. 98% способов легкого производства данных веществ из легкодоступных компонентов уже известны. Програма может предложить некоторые новые, сложные с недоступных компонентов, способы производства это Да, но это не повлияет на ситуацию.

Нейронные сети хорошо распознают картинки и с текстом проблем нет. ИИ будет сам находить нужную информацию и применять для создания новых веществ — мечта фантаста.

Это уже не фантастика, уже есть стартапы, на это ориентированные. Научились даже вытаскивать из сообщений в твиттере средствами text mining полезную информацию для создания лекарств.
Sign up to leave a comment.

Articles