Объединяем SCADA, MES и ERP без «мусора на входе» / Хабр

Взаимодействие промышленных и корпоративных систем — важная бизнес‑задача. И здесь стоит привести в качестве примера историю, знакомую каждому промышленному аналитику. Вы получаете задачу: предсказать удельный расход электроэнергии на тонну продукции. У вас есть три источника: SCADA фиксирует мгновенную мощность каждого электродвигателя с частотой раз в секунду, MES хранит данные о выпуске продукции по операциям — каждые 15 минут, но только при завершении цикла, и ERP знает, сколько сырья было отпущено в цех, но обновляет это значение раз в час и округляет до килограммов.

Вы аккуратно собираете данные за месяц. Строите модель, но в результате получаете полную кашу: коэффициент детерминации может быть в районе 0.3, а на некоторых днях модель показывает отрицательный расход электроэнергии, что абсурдно.

Естественно, первое, что приходит в голову, это плохое качество модели. Но на самом деле проблема скрывается совсем не в модели. Дело в том, что вы пытались объединить данные, которые изначально не были спроектированы для совместной аналитики. Каждая система решала свою задачу. SCADA отвечала за контроль в реальном времени — ей важна быстрота, а не долговременная согласованность. MES отслеживала выполнение операций, а для нее важны границы цикла, а не мгновенные замеры. ERP управляла движением ресурсов — ей важны целочисленные списания, а не непрерывный поток.

Эта проблема называется семантической несогласованностью. Это не ошибка в данных в обычном смысле — когда датчик сломан или оператор ввёл неверное значение. Это системное расхождение в самом понимании того, что означают цифры. И классические методы очистки данных здесь бессильны, потому что вы заменяете не сломанный датчик, а разные миры пытаетесь склеить.

Три главных источника несогласованности в промышленности

Чтобы понять, как лечить проблему, нужно разобрать её составляющие. В промышленных ИТ‑системах семантический разрыв возникает из трёх корневых причин, и они редко действуют поодиночке.

Первая причина — разная временная дискретизация и логика агрегации. SCADA обычно хранит данные по принципу «последнее значение» или «среднее за интервал», но делает это не всегда равномерно. Протокол Modbus может отдавать значение по запросу, OPC UA передаёт изменения с привязкой ко времени.

В результате у вас есть временной ряд с неравномерным шагом и deadband — когда датчик молчит, пока изменение не превысило порог. MES, напротив, хранит данные как события: операция началась, операция завершилась.

Агрегировать непрерывный процесс в дискретные операции — первое место, где рождается несогласованность. Например, как распределить расход электроэнергии за час между тремя операциями, если одна длилась 25 минут, вторая 30, третья 5, а датчик фиксировал мощность каждые 5 секунд? Любой алгоритм будет создавать артефакт.

Вторая причина — разные единицы измерения и номинальные диапазоны. На первый взгляд это звучит тривиально: бары против паскалей, килограммы против тонн. Но в промышленности всё сложнее. Давление может быть абсолютным или избыточным. Температура — компенсированной или нет. Расход — нормальным или приведённым к стандартным условиям. Когда SCADA показывает «расход 1000», а MES — «объём 980», оба значения могут быть истинными: первое — при 20 градусах Цельсия, второе — при фактической температуре среды. Без явного указания контекста вы сравниваете несравнимое.

Третья причина — разная идентичность объектов и границы учёта. В SCADA оборудование опознаётся по тегу — например, TT-1011 (температура теплообменника № 1011). В MES этот же теплообменник называется «Аппарат Т-10» и принадлежит другому иерархическому уровню. В ERP у того же физического объекта может быть инвентарный номер из совершенно другой системы кодификации. Аналитик тратит дни на то, чтобы построить словарь соответствия. Но даже когда идентификация решена, остаются границы: относится ли промывка теплообменника к эксплуатационным затратам или к техническому обслуживанию? Ответ зависит от того, какую систему вы спрашиваете.

Сочетание этих трёх факторов и порождает феномен, который можно назвать «тихой несогласованностью». Вы не видите явных ошибок — ни выбросов, ни пропусков, ни сбоев связи. Все числа легальны, все формально корректны. Но вместе они дают бессмыслицу, и это самый коварный вид проблем с данными, потому что он не сигнализирует о себе стандартными дашбордами качества.

Находим пропажу 15% сырья и это не ошибка

Лучше всего семантическая несогласованность видна на конкретном примере. Возьмём реальную ситуацию с металлургического комбината. На предприятии заметили, что отчёт о материальном балансе сходится плохо: по данным MES, в доменную печь ушло 1000 тонн агломерата. По данным ERP, со склада списалось 1150 тонн. Расхождение в 15% держалось месяцами. Финансовый директор требовал найти «воров», главный инженер говорил о погрешности весов, ИТ‑директор разводил руками, а охрана на выезде с завода еще активнее досматривала машины.

Команда аналитиков потратила три недели, и в итоге они выяснили, что ни одна система не врала. Всё дело было в разных определениях слова «тонна». В ERP списание происходит по весам при выгрузке из бункера. Весы дают значение с точностью до одного килограмма, момент взвешивания фиксируется с точностью до секунды. Это «паспортная» тонна.

В MES расход считается по длительности работы питателя и его производительности — формуле вида «время работы умножить на производительность, которая получена при испытаниях и внесена в паспорт как константа». Эта «технологическая» тонна не перекалибруется, если влажность сырья изменилась, а питатель забился.

Но главное открытие ждало впереди. Расхождение объяснялось не только разными методами измерения, но и разными правилами учёта одной и той же операции. В MES операция загрузки считается завершённой, когда питатель остановился по сигналу датчика уровня. В ERP списание происходит в момент, когда диспетчер нажал кнопку подтверждения в интерфейсе. Между этими двумя событиями проходило от 10 до 45 секунд — время реакции человека. За это время через питатель проходило ещё несколько тонн сырья, которые учла одна система и пропустила вторая.

В данной ситуации решение оказалось не техническим, а процессным. Аналитики предложили изменить правило: ERP должна получать триггер списания не от диспетчера, а от автоматического сигнала MES об окончании загрузки. А в MES добавили периодическую автокалибровку производительности питателя по фактическим весам из ERP. Расхождение сократилось с 15% до 1.5% — и это уже списывалось на реальную погрешность весов.

Этот кейс иллюстрирует главное: семантическая несогласованность часто скрывается там, где все уверены в очевидности. Никто не думал, что тонна может быть разной, а момент окончания операции — предметом договорённости.

Строим семантический слой

Если нельзя просто «почистить данные» в каждой системе, что же делать? Ответ промышленной аналитики за последние годы сформировался вокруг идеи семантического слоя (или data fabric для промышленности). Это не отдельная база данных и не очередной ETL‑инструмент. Это набор правил и сервисов, которые превращают разнородные данные в единый, осмысленный источник для аналитики, не трогая исходные системы.

Первый принцип — явное документирование контекста. Каждый показатель, приходящий из SCADA, MES или ERP, должен иметь не просто имя тега, а полное метаописание: единица измерения не как строка «бар», а как «избыточное давление, приведённое к 20°C»; логика агрегации не как «среднее», а как «среднее арифметическое мгновенных значений за интервал, исключая периоды простоя по признаку X»; границы применимости — для какого режима работы, для какой номенклатуры продукции.

Без этого метаописания любые два показателя нельзя сравнивать. С технической точки зрения это означает, что вы не складываете два числа в SQL‑запросе, а вызываете специальный сервис, который знает, как привести их к общему знаменателю.

Следующий важный принцип — это многоуровневая верификация. Одиночная проверка «значение в диапазоне» не ловит семантические разрывы. Здесь вам потребуется несколько проверок. Сначала проверка на уровне датчика или первичного источника: не вышел ли сигнал за физические пределы, не застыл ли на константе.
Затем проверка на уровне агрегата или техпроцесса: не противоречит ли сумма расходов на входе и выходе закону сохранения массы с учётом погрешности. И, наконец, проверка на уровне цеха или учётной единицы: не расходятся ли показатели оперативного учёта и бухгалтерского отчёта за пределами допустимого процента. Каждый следующий уровень включает в себя предыдущие и добавляет семантический контекст.
И еще один принцип — это каноническая модель времени. Все промышленные данные в семантическом слое приводятся к единому представлению о времени. Это звучит просто, но на практике оказывается самым сложным. SCADA живёт в физическом времени с точностью до микросекунд, но с неравномерной сеткой. MES живёт в технологическом времени — начала и окончания операций.

ERP живёт в учётном времени — закрытых периодах, сменах, сутках. Семантический слой вводит понятие «аналитического момента»: для каждого источника определяется момент, к которому относится значение, и допустимый лаг.

Например, запись MES об окончании операции считается актуальной для аналитики только через 30 секунд после получения — чтобы гарантировать доставку последних данных SCADA. Это антиинтуитивное правило для понимания человеком, но оно избавляет от тысяч false‑выводов.

А что на практике

Теперь давайте поговорим о том, что сейчас есть на рынке. За последние три года появились инструменты, которые автоматизируют часть работы по построению семантического слоя, хотя и они полностью проблему не решают.

В области управления метаданными промышленные аналитики всё чаще используют решения класса Data Catalog с поддержкой временных рядов. Такие инструменты, как Unity Catalog от Databricks (с его недавним расширением для телеметрии) или Open Source‑решения вроде Amundsen, адаптируются для промышленности за счёт кастомных коннекторов к OPC UA, Modbus, MQTT. Они позволяют хранить не только структуру таблиц, но и описанные выше контекстные правила.

Для задачи приведения временных сеток к единому формату популярны потоковые движки с поддержкой асинхронных окон. Apache Flink и RisingWave позволяют задать «окно ожидания» (allowed lateness), которое как раз реализует тот принцип «аналитического времени», о котором шла речь. ClickHouse, часто используемый как аналитическое хранилище в промышленности, предлагает функции для работы с временными рядами с неравномерным шагом — например, timeSeriesGapFill для интерполяции пропусков.

Но здесь важно предостеречь от иллюзии, что инструмент решает проблему. Инструменты помогают реализовать семантический слой, но не придумывают правила согласования за вас. Правила должна вырабатывать команда, которая понимает и технологический процесс, и учётные политики предприятия. Самый частый провал внедрения выглядит так: завод покупает дорогую платформу управления данными, подключает к ней все системы, а на выходе получает тот же хаос, только с красивой визуализацией. Потому что никто не сел и не ответил на вопрос: «А что на самом деле для нас значит показатель „производительность“?»

Поэтому практический совет для руководителя, который хочет начать, не требует миллионов рублей на софт. Начните с малого. Выберите один технологический процесс, где расхождения данных видны невооружённым глазом. Соберите людей из трёх миров: SCADA‑инженера, технолога из MES и экономиста из ERP. Задайте им один вопрос: «Что означает число 100, когда вы выгружаете отчёт?» Разница в ответах будет той самой семантической несогласованностью.

Задокументируйте её одним абзацем. Согласуйте единое определение. Пропишите правило конвертации. Повторите для следующего показателя. Через месяц у вас будет пусть маленький, но живой семантический слой. Он будет стоить не миллион, а десять ежедневных совещаний, зато он будет работать.

Выводы

Промышленная аналитика страдает не столько от грязных данных в классическом понимании, сколько от данных, которые чисты, но по‑разному осмыслены. SCADA знает одно, MES — другое, ERP — третье, и все три правы в своей системе координат. Беда приходит в момент, когда их пытаются смешать без единого семантического соглашения.

Рецепт лежит не в алгоритмах, а в дисциплине описания контекста. Каждый показатель должен иметь не только числовое значение, но и явно определённые «правила чтения»: единицу измерения с условиями применения, временную привязку с понятным лагом, границы учёта с указанием, что включено, а что нет. Без такой дисциплины ни один инструмент — ни ClickHouse, ни Flink, ни современный каталог данных — не спасёт.

И последнее, что хотелось бы отметить. Семантическая согласованность — это не разовая работа. Промышленное предприятие живёт непрерывно меняющимися условиями: откалибровали датчик, изменили рецептуру, обновили версию MES, пересмотрели учётную политику. Каждое такое изменение потенциально рушит старые соглашения. Поэтому семантический слой требует хозяина.

Сейчас это редкая роль на промпредприятии, но, возможно, через несколько лет «инженер семантической согласованности данных» будет такой же обязательной позицией, как сегодня администратор SCADA или ведущий технолог. Потому что без него аналитика останется искусством героических усилий, а не промышленной дисциплиной.

Если после статьи захотелось разложить хаос данных по полкам — можно продолжить разбираться на открытых уроках OTUS. Темы хорошо ложатся в ту же проблему: как связать разрозненные источники, договориться о смысле показателей и выбрать архитектуру, которая не превратит аналитику в красивый дашборд с неправильными выводами.

Подойдут три бесплатных урока:

3 июня, 20:00 «AS IS хаос или TO BE контроль: как построить единую автоматизированную финансовую модель на основе неидеальных, разрозненных данных».
_{Разберем, как превращать разрозненные данные в управляемую модель, а не в очередной слой хаоса поверх старых систем.}
3 июня, 20:00 «Децентрализованная революция в управлении данными: Data Mesh и его четыре принципа».
_{Поговорим о подходе, в котором за данные отвечают доменные команды, а смысл показателей фиксируется ближе к источнику.}
17 июня, 20:00 «DWH, Data Lake и Data Lakehouse: архитектурные различия и практическое применение».
_{Поможем разобраться, какую архитектуру выбрать для хранения и анализа данных, когда источников много, а требования к аналитике разные.}

А чтобы не пропускать новые материалы про данные, архитектуру, аналитику и инженерные практики, подписывайтесь на блог. Здесь регулярно разбираем не только инструменты, но и проблемы, которые обычно всплывают уже после внедрения.

Объединяем SCADA, MES и ERP без «мусора на входе»

Три главных источника несогласованности в промышленности

Находим пропажу 15% сырья и это не ошибка

Строим семантический слой

А что на практике

Выводы

Публикации

Информация