Однажды, в начале третьего лета нейронок, на меня вышел представитель одного красного нефтехимического концерна. Прежде, его подразделение занималось цифровыми двойниками производств, но тут тема была интереснее - полидировать тему с машинным обучением для оптимизации Химико-Технологических процессов (ХТП). Соблазн повтирать очки был очень велик, но, я не берусь за проекта, которые сам считаю нереализуемыми.

Имея в своём багаже диссер по расчёту кинетики Последовательно-Параллельных реакций и соответствующего аппарата на тонких плёнках, я понимал, что тема в лоб не решается. Но, в то время, когда архитектуры нейронок рождались каждый день, как грибы после дождя, все считали: «достаточно иметь кучу данных, и тогда — всё можно решить!»

Мы спорили по телефону некоторое время, но, я не убедил своего собеседника в бесперспективности подхода «в лоб» — каждый остался при своём мнении.

У меня были текущие проекты и я, скоро, позабыл об этом разговоре примерно на год. Через год у нас в городе проходил небольшой сборный митап, где некая, интересующая меня, компания, представляла кучу automotive решений, на базе целого BMW, но, был и небольшой доклад по теме выше. Я не удивился, когда узнал фамилию докладчика и мне было очень интересно, каков результат этой темы через год.

Моя чуйка меня не подвела, хотя, я, даже, не предвидел масштаб проблем, в кратце:

  1. была нанята большая компания, которая взяла ВСЕ данные с процесса;

  2. проработав несколько месяцев, компания запросила ещё данных;

  3. проработав ещё несколько месяцев, был выдан результат, который был слабо отличим от оптимальных значений текущего процесса, рассчитанного по "теплым" (ламповым) моделям

Поясню немного, как работает оптимизация ХТП - процесс, в общем случае, состоит из набора аппаратов, где происходят химические или физические процессы, каждый аппарат имеет наборы моделей:

  1. кинетики, для химических процессов

  2. газо/гидро динамики

  3. процессов растворения/выделения/поглощения для межфазных переходов, так как реакции часто идут между веществами, находящимися в разных фазовых состояниях

  4. процессов тепло/массо передачи

Большинство этих моделей - диффуры в частных производных. На большинство аппаратов существует более одной модели, и каждая из них хорошо работает только в каком-то диапазоне режимов, и плохо в другом. А также, надо всегда помнить - ЛЮБАЯ МОДЕЛЬ, ЭТО УПРОЩЕНИЕ И ПРИБЛИЖЕНИЕ, а уж тем более её численное решение.

Когда создаётся ХТП, известен набор целевых продуктов, а посему от него выбирается и набор аппаратов и их режимы. Затем, для выбранных аппаратов и режимов, собирается набор моделей, из которого составляется огромная система диффуров и долго, нудно считается обычными численными методами. Иногда, делается опытная установка, на которой обкатывается процесс, ищутся скрытые проблемы, которые не всегда видны из численного решения, так как модель, это ВСЕГДА некоторое упрощение.

Также, на химических установках ВСЕГДА есть оборудование КИПиА, которое следит, что бы процессы не выходили за положенные режимы и не уходили в опасную (аварийную) зону.

Я всё описал, очень упрощённо, что бы пояснить предметную область и данные, что, обычно, имеются в распоряжении эксплуатантов химического оборудования на предприятиях.

И вот из всего, вышесказанного, следует, что каждый аппарат, в действующем ХТП, работает в узком коридоре своих возможных параметров, а значит и данные собранные с реального оборудования (фичи) — лежат в узком коридоре.

При этом, не исключено, что, даже для выбранного набора аппаратов, в составе ХТП, можно подобрать другой коридор, с другим решением, на которые не попали при численном решении огромной системы диффуров.

Так, вывод из доклада — поиск решения с помощью нейронок на данных, которые собраны в узком коридоре пространства параметров даёт решение ТОЛЬКО В ЭТОМ КОРИДОРЕ.

Вывод был ожидаемым, хотя, умозрительно, за год до этого — трудноформулируемым,.. не всегда можно понять и аргументированно объяснить свою чуйку.

Но, неудача, хоть и не моя, меня только раззадорила в поиске решения, и после нескольких прогулок под луной решение родилось:

НЕ НУЖНО ПРОТИВОПОСТАВЛЯТЬ ЛАМПОВЫЕ И ЦИФРОВЫЕ МОДЕЛИ, ИХ НУЖНО ОБЪЕДИНИТЬ.

То есть:

  1. для каждого из набора выбранных аппаратов, подбираем несколько моделей, разной степени точности и приближенности �� разных сегментах его пространства параметров;

  2. генерируем данные по всему пространству параметров, проставляя, отдельной фичёй точность/доверенность этой модели в текущей точке;

  3. теперь запускаем нейронку

Как по велению судьбы, в нашем небольшом городе N, буквально через неделю, проходил митап одного бирюзового нефтехимического концерна, по использованию машинного обучения в химии. Конечно же, я на него зарегистрировался. Было это в самый раз, перед ковидом, так что всё ещё проходило оффлайн, в небольшом зале в центре города.

Ребята много рассказывали, как решаются транспортные задачи и ценообразование на основе предсказания спроса. Учитывались и потребности местных потребителей, и цикличность обслуживания/ремонта ближайших производств, и наличие подвижного состава в выбранном направлении,... В общем, это была интересная многомерная задача, призванная увеличить выручку с имеющегося/планируемого объёма продукта.

Но, меня интересовало — есть ли у них наработки по изменению этого объёма или стоимости его производства, путём оптимизации самого ХТП. И когда финальный докладчик (который был не просто машинлёнром или лидом, а большим начальником), я задал прямой вопрос — планируется ли создание гибридных «лампово‑цифровых» моделей.

Было видно, что вопрос немного застал врасплох, он выходил за темы докладов, но, ответ был примерно такой: «да, мы планируем создавать подразделения математиков для подобных решений».

С тех пор прошло несколько лет, прошёл ковид и началась СВО. IT ландшафт �� стране серьёзно поменялся, структура химической промышленности тоже претерпевает серьёзные изменения, но, я продолжаю искать материалы по этой теме,.. только вот что-то никак...