Взгляд химика, тестировщика и аналитика данных на чёрную металлургию и большие данные в ней

    Всем привет. Меня зовут Александр и я химик тестировщик аналитик данных. Как и многие люди моего поколения, я работаю не по специальности. После химфака МГУ и пяти лет работы младшим научным сотрудником в области химической технологии я переметнулся в IT и стал тестировщиком ПО. Помню, как мама говорила мне, чтобы я попробовал найти работу, где будут сочетаться химия и информационные технологии, но в тот момент я считал, что такого не бывает.

    Ну и как это часто бывает, жизнь подбросила новые возможности и вот я в здесь – в компании Datana, где неожиданно для самого себя успешно сочетаю несочетаемое: анализ данных и знание химии.



    Основное направление работы Datana сейчас – оптимизация непрерывных промышленных процессов на отечественных производствах. Пока что мы сосредоточились в основном на чёрной металлургии и начинаем расширяться на цветную. Мы далеко не первые в этой отрасли, в ней уже присутствует несколько известных IT-игроков (и много менее известных). Кроме того, многие крупные металлургические компании, такие как Северсталь и НЛМК, активно развивают компетенции анализа данных внутри себя. Однако спрос на “цифровизацию” промышленности постоянно растёт, так что работы тут хватает на всех.

    За полтора года Datana проделала большой путь от успешного пилотного проекта до десятка проработанных кейсов и нескольких параллельных крупных проектов в работе. По дороге мы подробно разобрались в современных технологиях производства стали, побывали на многих металлургических заводах, а самое главное – основательно изучили особенности анализа производственных данных.

    В этой статье я хочу рассказать о развитии технологий выплавки стали и современном положении вещей в этой области, а также об особенностях работы с производственными данными.

    Краткая история чёрной металлургии


    Железо известно человечеству очень давно, это один из семи “металлов древности”, наряду с золотом, серебром, медью, свинцом, оловом и ртутью. Поначалу люди имело дело только с самородным железом, источником которого были ядра железно-никелевых метеоритов. Понятное дело, встречались они не очень часто, так что метеоритное железо было довольно редким и дорогим материалом и использовалось в основном в ритуальных целях. Извлекать железо из руды люди научились сильно позже, но тоже довольно давно. Принято считать, что чёрная металлургия возникла с началом железного века в Средней Азии и появлением первых железных орудий около 3000 лет назад. Причём, в других регионах железный век наступал позже, иногда на тысячелетия. Технология кочевала по планете, её забывали и “открывали” вновь.

    Первым способом выплавки железа считается сырое дутьё. В глиняную сыродутную печь загружали шихту – прокалённую в костре и размолотую железную руду, смешанную с древесным углём. Шихту поджигали и, так как воздух в печь поступал самотёком, как в обычный костёр, горение шло медленно, около суток. В процессе из печи вытекал шлак, выносящий из шихты до 80% железа. В конце концов получалась крица (или сыродутное железо) – большой кусок твёрдого железа с включениями из застывшего шлака и недогоревшего угля. Крица получалась больше размером, чем отверстие для загрузки шихты и поддува, так что извлечь её без разрушения стенки печи было невозможно. Но почему же не сделать отверстие побольше? Потому что тогда в печи не будет тяги и шихта не будет гореть. Так что печь каждый раз частично разрушали, чтобы извлечь крицу, которую затем ковали, чтобы механически выбить из неё куски шлака и угля. Придание крице нужной формы было только побочным результатом ковки. Печь потом восстанавливали, благо это относительно просто – она же глиняная.

    Из кричного железа делали примитивные орудия труда, которые, однако, превосходили деревянные. Затем, само собой, начали изготавливать оружие, которое было прочнее и дешевле бронзового – произошёл переход от бронзового века к железному.

    За прошедшие с тех пор несколько тысяч лет железо стало одной из основ человеческой цивилизации. Чёрная металлургия прошла долгий путь от метеоритного железа и первых сыродутных печей до современного сталелитейного производства. Основные вехи этого пути я собрал в таймлайн.



    На некоторых этапах я хочу остановиться подробнее.

    Например, примечательна история дамасской стали и булата, это пример технологии, в чём-то опередившей своё время, но оказавшейся тупиковой ветвью. В погоне за высоким качеством металла древние металлурги, действуя методом проб и ошибок, нащупали несколько способов повысить качество кричного железа. Булат получается, если соединить между собой высокоуглеродистый чугун и железо так, чтобы содержание углерода в объёме было неоднородным. Это был сложный и ненадёжный способ и по мере развития технологии о нём забыли. В XIX веке технология была восстановлена, но признана нетехнологичной и неактуальной. С дамасской сталью история похожая, отличие в том, что неоднородность состава достигалась многократной перековкой и послойной сваркой чугуна с железом. Ко времени открытия и булат и дамаск значительно опережали по качеству обычное кричное железо, но получать их было сложно и дорого, секрет технологии тщательно оберегался и постепенно затерялся. Но мифы остались, поначалу вполне обоснованные, но по мере развития основной технологии они становились всё менее правдоподобными.

    Примерно до XVII века развитие чёрной металлургии было количественным: увеличивался объём печей и высота труб, росла температура внутри; оптимизировались операции загрузки шихты и выгрузки крицы. По сути, переломным моментом стало достижение в печи температуры плавления чугуна (1300°C), а затем и стали (~1500°C).

    Для заинтересовавшихся историей применения железа: на Вики есть отличная статья, откуда и взяты все факты для таймлайна.

    Чёрная металлургия сегодня


    Устоявшаяся технологическая цепочка получения стали на верхнем уровне состоит из следующих стадий:

    1. Дóбыча и обогащение руды
    2. Восстановление железа из руды коксом в доменной печи с получением чугуна
    3. Передел чугуна в сталь
    4. Обработка стали (горячий или холодный прокат)



    К концу XIX века оформились три основных технологии, применяемых для передела: конвертерный, мартеновский и электротермический процессы.

    Конвертерный процесс



    Он же бессмеровский, прямой наследник сырого дутья. Чугун, полученный в доменной печи, переливают в конвертер, где продувают воздухом, лишний углерод выгорает с выделением тепла и образуется жидкая сталь, которую не нужно механически очищать от шлака и угля, а остаётся только отлить в нужную форму. За прошедшие с тех пор более 150 лет конвертерный процесс почти не изменился, главное отличие в том, что сейчас вместо воздуха через чугун продувается чистый кислород под давлением.

    Мартеновский процесс



    В мартеновскую печь кроме чугуна помещали железную руду и металлический лом. Имея некоторые преимущества над конвертерным (возможность переработки металлолома и простота контроля химического состава стали), мартеновский процесс обладает критическим недостатком – большой продолжительностью. В современном кислородном конвертере чугун превращается в сталь за 30 минут, а в мартеновской печи это занимает несколько часов. Так что сейчас в мире уже практически не осталось действующих мартеновских печей, воспетых в советском искусстве.

    Электротермический процесс



    В конвертерном процессе нагрев шихты происходит за счёт экзотермических химических реакций. Но благодаря одному из важнейших открытий эпохи Просвещения – электричеству – появился новый способ: электродуговой нагрев. Причём, электричество одинаково эффективно нагревает как чугун, так и металлолом, так что дополнительным преимуществом этого подхода стала возможность его переработки.

    Поначалу доступных источников электричества достаточной мощности в мире просто не было и примерно до середины XX века бал правили конвертеры и мартены, но как только настала эпоха дешёвого электричества, электротермический способ начал бурно развиваться.

    Доменный процесс в целом сохранился с XIX века без существенных качественных изменений. Само собой, количественно он сильно продвинулся, но на многих заводах до сих пор работают доменные печи, построенные сто и больше лет назад.

    Для передела чугуна в сталь применяются две технологии выплавки из трёх, описанных в предыдущем разделе: конвертерный и электротермический процессы. Соответственно, в основе современного сталелитейного цеха находится либо кислородный конвертер (КК), либо дуговая сталеплавильная печь (ДСП, не путать с ДСП).

    Эти процессы мирно сосуществуют, не вытесняя друг друга, так как имеют дополняющие друг друга особенности.



    Кое-где ещё работают мартены, но в целом этот способ производства стали отходит в историю. В 2018 году в России была остановлена последняя крупная мартеновская печь на Выксунском металлургическом заводе. Кстати, один из не так давно остановленных мартеновских цехов находится на территории Ашинского металлургического завода (АМЗ), где команда Datana работала в 2018 – 2019 годах и о чём на Хабре опубликовано уже несколько статей. Первая из трёх мартеновских печей проработала там ровно 100 лет, с 1910 до ноября 2010 года.

    Рядом с мартеновским цехом в АМЗ построен новый электросталеплавильный цех №2 (ЭСПЦ 2), где работает современная ДСП-120. Кстати, именно на АМЗ сталь получают исключительно из металлолома, доменный цех там остановлен ещё в 1986 году.

    А вот на Магнитогорском металлургическом комбинате (ММК) передел чугуна в сталь происходит в кислородно-конвертерном цеху (ККЦ), где мы работаем с конца 2019 года и реализуем ряд кейсов на разных участках и агрегатах.



    Так что наша команда не понаслышке знакома с обеими основными технологиями получения стали. И, само собой, мы хорошо знакомы с особенностями реальных производственных данных, о чём и поговорим дальше.

    Производственные данные


    По нашему опыту предприятия “реального сектора экономики” пока что не очень дружат с миром IT. Приведу пример из опыта личного. Когда в 2006 – 2011 я годах работал в производственном НИИ, локальная сеть в нашей лаборатории была построена на коаксиальном кабеле с топологией “кольцо”. Основным портативным носителем данных во всём институте была дискета 3.5”, а флешки были чем-то диковинным и подозрительным. Своим первым достижением в IT я считаю замену коаксиалки на витую пару. Это положение вещей со временем меняется в лучшую сторону, но в целом проникновение цифровых технологий в производство в нашей стране идёт довольно медленно и неравномерно. Это приводит к целому ряду особенностей и проблем, возникающих при работе с данными “с завода”.

    В наших руках побывали данные из разных цехов нескольких заводов как чёрной, так и цветной металлургии, что позволило составить список признаков, отличающих производственные данные от других.

    Особенности и проблемы промышленных данных


    Источники и преобразования


    Тёплый аналоговый сигнал

    Данные откуда-то берутся, так что начнём с источников данных и их пути к хранилищу. Например, в веб-аналитике данные собираются через стандартные API и аккуратно складываются, скажем, в ClickHouse или Cassandra и всегда доступны в удобном виде… Ладно, само собой, так не бывает почти никогда. Но всё же на производстве значительная часть данных рождается в аналоговых датчиках, фиксирующих те или иные физические или химические параметры процесса, поэтому сначала имеют форму электрического импульса. Разнообразие применяемых датчиков очень велико: простые механические контакты, электроизмерительные приборы, расходомеры (для газов, жидкостей и порошков), термопары, тензодатчики, вибродатчики и многие другие. На одном агрегате может быть несколько сотен датчиков разной сложности, сигналы с них собираются контроллерами, причём многие — в реальном времени (с дискретностью в десятки и единицы миллисекунд), и отправляются в АСУ ТП (автоматизированная система управления технологическим процессом), а оттуда уже попадают в базу данных. Или не попадают, но об этом чуть позже.

    Кроме датчиков источниками данных могут быть более сложные приборы, начиная с более-менее привычных всем видеокамер (часто с помощью ИК-камер измеряют температуру) и заканчивая спектрометрами и рентгеновскими потоковыми химическими анализаторами. Почти все производители сложного оборудования используют свои собственные форматы данных, так что в промышленных системах мы имеем дело с целым зоопарком: xml, json или, например, iba; промышленные протоколы вроде PROFINET или PROFIBUS; более привычные дампы Oracle и MS SQL. Иногда дамп БД предоставляется в распакованном виде, как набор текстовых файлов со списками CREATE-ов и INSERT-ов, которые мы парсим и запускаем. Бывает, что данные существуют исключительно в виде файлов, которые проприетарная система сохраняет на сервер, в этом случае боевая интеграция с источником данных может представлять собой bash-скрипт со стороны производства, который по расписанию кладёт в общую папку новый файлик, и скрипт с нашей стороны, который вычитывает этот файлик, парсит его и преобразует данные в более удобную для работы форму.

    Ручной ввод

    Но, к сожалению, пока что очень трудно встретить производство, где все технологические процессы оцифрованы полностью. Так что на всех производствах, с которыми мы работали, есть ручной ввод данных. Либо лаборант вручную вводит в Excel результаты химического анализа, либо старший смены вручную вводит номер плавки. Или, например, технолог каждый день вручную составляет в Excel табличку, по которой подготавливают исходное сырьё для загрузки в печь (это называется “паспорт шихты”). Чтобы не вбивать каждый день всё заново он копирует табличку и нет-нет да и пропустит случайно пару ячеек, оставив там вчерашние данные. Или прошлогодние.



    Часто инженерам доступно редактирование данных в БД, даже попавших туда автоматически.

    В большинстве случаев ручной ввод приводит к непреднамеренным ошибкам, но иногда “человеческий фактор” становится вполне преднамеренным, особенно, когда дело касается показателей, от которых зависит размер премии…

    Качество данных


    Объём и глубина

    В большинстве случаев хранилища на производстве не идут ни в какое сравнение с объёмами систем хранения данных дата-центров традиционных “айтишных” направлений или, например, банковского сектора. Поэтому заглянуть на год назад обычно можно, но набор показателей сильно прорежен по сравнению с доступным в реальном времени. А данные глубже одного года обычно не получается назвать большими даже с натяжкой, если они вообще имеются.

    Сюда же можно отнести тот самый случай, когда данные с датчиков идут, но так и не добираются до хранилища. Это происходит, когда объём доступной информации для завода избыточен и не собирается. Например, на заводе провели модернизацию, установили новый агрегат, со своей проприетарной информационной системой, которая собирает массу информации о ходе процесса. Мы видим список сигналов, радуемся изобилию, но не тут-то было: заводу почти всё это не нужно, поэтому большая часть не интегрирована с АСУ ТП, а часто даже и сотрудники производства не в курсе, что именно там есть, а чего нет.

    Пропуски, ошибки и задержки

    Набор реальных данных без пропусков встретить сложно, вопрос в том, сколько их. Пропуски возникают по разным причинам, самая простая из них – отсутствие данных в конкретный момент времени или случайная ошибка при записи в БД. Но в условиях производства появляются дополнительные источники потери данных. Например, отошедший контакт у одного из сотен датчиков, сигнал которого не критичен для ведения процесса, но жизненно необходим для моделирования, может привести к непригодности массива данных на значительном интервале.

    Часто пропуски связаны с вводом данных вручную, который мы обсудили выше.
    Ошибки в данных, в целом, возникают по тем же причинам, что и пропуски. Например, мы постоянно встречаемся с нулевыми или даже отрицательными значениями параметра “вес”. Однократный сбой датчика весов – и мы уже не можем узнать, сколько именно феррохрома было “отдано” в печь в ходе конкретной плавки. Нулевой вес несложно отследить и отбросить, но если весы просто неправильно откалиброваны – мы можем про это узнать чисто случайно или вообще не узнать.

    А бывают ошибки просто необъяснимые. Из недавнего: загружал заводские данные в нашу базу и запрос в какой-то момент упал. Начал разбираться и обнаружил, что в данных есть некоторое количество записей за 31 ноября, и умный Postgres такую дату в поле с типом Date вставлять не захотел. Как оно так получилось и какая дата там должна быть я не знаю. Вероятно, в заводской БД дата хранится в поле с общим текстовым типом и в какой-то момент дата поплыла.
    Обычно новые данные доступны в реальном времени и мы боремся максимум за считанные секунды запаздывания. Но на производстве бывает, что какой-то нужный показатель попадает в информационные системы завода через несколько часов или даже дней. Идёт плавка, берётся проба шлака на химический анализ, а его результат будет занесён в систему только вечером. А если плавка ночная, то вообще через сутки. Это не критично, когда мы исследуем исторические данные и обучаем модели, но когда нам нужно формировать рекомендации по ведению процесса в реальном времени – это бывает важно.

    Смысл данных

    Если вы отраслевой эксперт и прекрасно понимаете специфику производства, вы отлично понимаете, что значит тот или иной параметр в базе. Но если нет, то показатели вроде таких могут поставить вас в тупик:

    Система поднятия сосуда. Управляющий клапан подвижной площадки 1. Вверх
    Торкретмашина.Режим торкретирования.Манипулятор/Ручная фурма


    Мы работаем в плотном контакте с технологами и у нас есть документация, так что все показатели уже стали нам более-менее понятны, но поначалу подобные примеры вызывали у нас нервный смех.

    Кто-то может сказать: “ну мы же аналитики данных, засунем всё в модель и она сама расставит веса показателям и отбросит ненужные, зачем нам разбираться вообще?!” – и будет неправ.



    Понимание смысла показателей позволит сформировать первичное ограниченное пространство признаков, представленных в наиболее адекватном виде для максимально объективного моделирования производственных процессов. При необходимости пространство можно будет расширить, но с пониманием смысла данных можно сразу отбросить те показатели, которые не будут оказывать большое влияние на условную (или фактическую) целевую метку. Кроме того, часть показателей могут быть заведомо зависимы. И часто бывает, что для выявления таких скрытых зависимостей выгоднее применить экспертные знания, а не статистический анализ.

    Как с этим жить


    На мой взгляд, главный вывод, который можно сделать относительно производственных данных – они есть! Ещё относительно недавно получить данные с завода в “цифровом” виде было утопией. Они либо были аналоговые, либо оцифровка была фрагментарной, что в целом не позволяло с ними нормально работать. Но сейчас данные в промышленности есть, и с ними можно работать. Само собой, перечисленные выше особенности не облегчают анализ этих данных, но и не делают его невозможным. Если подходить к этой задаче комплексно, сочетая приёмы анализа данных с пониманием физико-химических основ процессов и погружаясь в отраслевую специфику, результат будет сравним с классическими для анализа данных направлениями.

    Весь мир постепенно становится цифровым. В сфере развлечений и потребительских услуг это происходит интенсивнее, в сфере производства более осторожно. Но я уже встречал формулировку “Сельское хозяйство 4.0” пару лет назад, так что тенденция, думаю, очевидна всем. Так что всем нам предстоит освоение многих неожиданных специальностей и областей знания, и это замечательно! К моменту публикации этой статьи я, скорее всего, уже побываю в командировке на Челябинском цинковом заводе в качестве аналитика и отраслевого эксперта, ведь вслед за чёрной металлургией мы уже начали освоение цветной.

    P.S. По прошествии нескольких часов вижу, что интерес к статье есть, но к обсуждению она не побуждает:)
    Читая Хабр уже больше 10 лет, я впервые написал что-то сам, так что буду рад любой обратной связи. Я готов рассказать больше подробностей, ответить на вопросы, обсудить опыт читателей!
    Datana
    Компания

    Комментарии 16

      +2
      Имел опыт работы над проектом по моделированию свойств полимеров, резин и пленок для одного из крупных российских компаний химической промышленности. Большинство трудностей вызывает именно работа с сырыми данными. Кроме того имеется проблема со сбором данных, в моем случае это именно ручной ввод данных операторами в бумажные журналы, и, в последствии, было обнаружено много очевидных ошибок в данных. Как итог, высокая зашумленность данных привела к низкому качеству полученных моделей. Кстати, в качестве дополнительных исследований пришлось разрабатывать методы, которые позволяют определять ошибочные записи в данных, чтобы обосновать низкую точность моделей. Кроме того имеет место быть сильное смещение в исходных данных: как правило, операторы исследовательских отделов стараются подобрать оптимальные условия синтеза полимера, при этом при подборе они исходят из собственного профессионального опыта, что позволяет им задать более или менее оптимальные условия. В итоге получается, что при моделировании мы видим только уже примерно хорошие входные параметры синтеза и хорошие выходные свойства полимера, другими словами модель не видит плохих примеров и синтеза и обучается в очень узком диапазоне входных параметров, что значительно ограничивает область ее применимости. В целом, хочется подчеркнуть, что есть проблемы, которые являются общими для промышленных процессов, что требует нестандартного подходы к решению проблем возникающих при моделировании.
        0
        Спасибо за подробный комментарий!
        Да, кстати, бумажные журналы — это и правда неизбежное зло пока что. Меньше 2 недель назад были на заводе цветной металлургии, там в одном из цехов почти нет данных в цифровом виде, все результаты химического анализа собираются в аналоговые журналы, которые затем отправляются в архив.
        Так что наше предложение по цифровой трансформации этого цеха состояло в переходе на Excel для начала, и в накоплении массива данных хотя бы за полгода.

        И спасибо за наводку про смещение данных при ручном вводе, изучим этот вопрос:)
        0
        Работаю в металлургии, много взаимодействую с заводами.
        Подтверждаю значительную консервативность предприятий в отрасли (и не только в пост-СССР, впрочем).
        А чем занимаются в данной области коллеги за рубежом Вы интересовались?
          0
          За работами зарубежных коллег в области цифровой трансформации и оптимизации производства мы, конечно же, следим, но пока что поработать с ними непосредственно не довелось. Сейчас сосредоточены на российских предприятиях, но у нас есть амбициозный план по выходу на международный рынок! Знаем, что как минимум в чёрной металлургии в этом плане лидируют Германия (в которой и появилась программа Industrie 4.0) и Южная Корея. Знакомы, например, с продукцией Danieli. Для тех, кто незнаком с миром металлургии: это производитель высокотехнологичных агрегатов и даже целых заводов под ключ для металлургической промышленности.

          В этой ситуации радует то, что несмотря на консервативность, на всех предприятиях, где мы бывали, есть не только понимание необходимости развития, но и уже делаются реальные шаги в этом направлении (иначе мы бы туда не попали). На некоторых заводах этими вопросами занимаются отделы КИПиА или IT, а кое-где сформированы специальные структуры, вроде Бюро по развитию. И, кстати, они обычно тоже в курсе мировых новостей в своих отраслях.
            0
            В общем, мне не показалось, что зарубежные коллеги очень неохотно делятся информацией по этой теме.
            Да, по моим наблюдениям Сименс и Даниэли начали «копать» в этом направлении, но даже у них (при их-то монополии) получается довольно медленно. Как по мне, просто не с того конца начали. Майкрософты в этом отношении совершенно случайно начали действовать правильнее.
          0

          Учился по специальности "Металлургия стали", в 2000-х был на Череповецком Металлургическом, наблюдал двух еще живых "динозавров" в мартеновском цеху… Больше всего запомнилось, как рабочий пробивал лётку для выпуска, и когда пошел металл, его всего окутало расплавленными искрами, брызгами, а он стоял как ни в чем не бывало.
          В данный момент как раз совершаю переход от тестировщика в аналитику данных. Было интересно почитать статью, спасибо! В частности, очень удивил консерватизм на пром. предприятиях. Вроде во все том же ООО "Северсталь" есть свое собственное ИТ-подразделение, и в то же время — ручные записи в журналы… Вообще тема ИТ в промышленности довольно интересная и нераскрытая, хотелось бы больше публикаций.
          В частности, хотелось бы узнать у автора, какие боевые задачи приходилось решать, какие инструменты использовались, каким образом справлялись с трудностями и т.д. Буду с интересом следить за темой!

            0

            Рад приветствовать коллегу со схожим извилистым путём в профессии:)


            Тему раскрываем! У нас опубликовано уже несколько статей. Если ещё не читали — рекомендую!
            В черную металлургию за реальными делами: опыт Datana
            Как мы побывали на металлургическом заводе в Аше
            А одна из реальных боевых задач описана вот тут:
            Как мы внедряли искусственный интеллект на металлургическом заводе
            Сейчас задачи стали существенно сложнее: уже не только разрабатываем модели, но и занимаемся установкой датчиков на агрегаты, собираем сырые данные с контроллеров.


            Уровень цифровой трансформации предприятий сильно неоднороден, в том числе, и внутри компаний. Так что Вы правы, в Северстали и, скажем, НЛМК действительно есть подразделения не просто IT, а конкретно занимающиеся анализом данных и машинным обучением. Тем не менее, и с этими компаниями мы находим общие точки и проекты, работы хватает.

            0

            Промахнулся комментарием, это был ответ на комментарий выше.

              0
              Извините за несколько странный вопрос. По-моему, описанным в статье (фактически — разгребанием бардака) должны заниматься технолог и бизнес-аналитик. Что такое «цифровое с/х» я примерно понимаю — собираем данные с более высокой детализацией, чем делалось раньше, грубо говоря, переходим с квантования по гектарам на квантование по метрам, вносим минимум воды и удобрений, собираем по готовности, а что такое «цифровая металлургия»? Вот у нас конвертер на 5 тонн чугуна, вот к нему технология, что мы можем улучшить, если технология соблюдается?
                0
                Качество соблюдения технологии?
                  0
                  Как именно? Извините за наивные вопросы, но я с металлургами только пил.
                  0

                  Спасибо за вопрос!


                  Описанный бардак и его разгребание — это лишь первый этап работы, которую мы делаем.
                  Чёрная металлургия состоит из последовательности химических и физико-химических процессов: окисление углерода и металлов кислородом и угарным газом, переход компонентов через границу шлак-металл, перемешивание металла газами.
                  Построить адекватную математическую модель плавки только на основании законов химии и физики практически невозможно — слишком много параллельных процессов, кроме того, крайне сложно оперативно получить точную информацию о состоянии системы из-за экстремальных условий (температура более 1500 градусов). В связи с этим технологические инструкции на заводах в значительной степени эмпирические.
                  Поэтому, имея достаточно большой массив данных, даже неточных, можно успешно строить оптимизационные модели, которые позволяют снижать расход материалов и энергии при том же результате. Например, если уменьшить расход добавок всего на 1% это может дать весьма существенную экономию, порядка миллионов или даже десятков миллионов рублей в год — при нулевых капитальных затратах.


                  Надеюсь, что ответил на тот вопрос, который был задан:)

                    0
                    Правильно ли я понял, что имея достаточно точные данные о входе и выходе (продукта и шлака), вы строите более точную модель происходящего в данном конкретном, например, конвертере?
                      0

                      Если под "моделью происходящего" понимается некое формализованное описание физико-химического процесса в конвертере, то это не совсем так. Модель машинного обучения может не быть интерпретируемой. То есть, давать результат "неизвестно как".
                      Но в целом всё та: чем больше данных и чем они точнее — тем лучше будет работать модель

                        0
                        Спасибо, так хоть стало понятнее :) А результат машинного обучения насколько хорошо переносится между конвертерами и входами сырья? Или надо каждый раз заново учиться, отбрасывая старые данные?
                          0

                          Это зависит от сложности модели. Если она основана, грубо говоря, на паре параметров — то теоретически может показать удовлетворительный результат на другом агрегате или на незнакомой марке стали, например. Также можно попробовать вручную "подкрутить" веса параметров, если они более-менее понятные.
                          Но это скорее исключение. Обычно модель учитывает множество параметров, да ещё и непонятно как. Так что проще будет обучиться заново, а скорее придётся конструировать новую модель с новыми гиперпараметрами.

                Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                Самое читаемое