
На нашем форуме по искусственному интеллекту RAIF прозвучал интересный кейс от Дмитрия Бочарова, вице-президента по внутреннему контролю и аудиту в Segezha Group. Дмитрий рассказал, как используются инструменты машинного обучения в крупнейшем деревообрабатывающем холдинге России и как преодолеваются препятствия на пути внедрений. Передаем ему слово.
Сначала несколько слов о компании
Segezha Group – один из крупнейших в стране вертикально-интегрированных деревообрабатывающих лесных холдингов.

Уверен, что многие из вас слышали про нашу компанию. В конце концов, если вы видели бумажный мешок в IKEA, «Азбуке вкуса» или «Ашане», то он произведен, в том числе, нашей компанией.

Сейчас я хочу донести, с одной стороны, ценность искусственного интеллекта в решении конкретных бизнес-задач, а с другой – рассказать про наш опыт и даже проектную боль, с которой мы столкнулись, когда занимались этим кейсом.
Процесс лесозаготовки
Для начала немного о том, как происходит лесозаготовка:

Лес рубят с помощью специальной техники – харвестеров. Затем заготовки вывозят на склады лесовозами с манипуляторами, чтобы уже оттуда по железной дороге или автотранспортом доставить на комбинаты, где производится целлюлоза, бумага, фанера, пиломатериалы и другая бумажная продукция.
Механизм замера лесопродукции
Одна из ключевых проблем даже не компании Segezha, а всей отрасли – это процесс замера этой самой лесопродукции, а точнее, бревен.

Как это происходит сейчас?

С помощью специальной линейки измеряется высота, длина и ширина штабеля, которая умножается на различные коэффициенты, прописанные еще при СССР в различных ГОСТах и отраслевых нормативах. Самый базовый коэффициент – это «коэффициент полнодревесности», то есть показатель реального количества кубов в штабеле за вычетом промежутков между бревнами. Именно здесь возникает проблема человеческого фактора – если сотрудник неопытный, он, скорее всего, измерит неточно.
Однако, самые большие трудности с точки зрения аудита – это сознательные нарушения, поскольку суммарная зарплата сотрудников, доставляющих нам лес, меньше, чем стоимость древесины в лесовозе (один кубометр стоит 4-5 тыс. рублей). Немного математики – и вот тебе возможности для различных сговоров, злоупотреблений, манипуляций…. Потом невозможно понять, сколько «леса» было на самом деле. Есть машина, есть даже акт с зафиксированным в нем количеством бревен, но было ли их там именно столько – никаких подтверждений нет, кроме тех, что они намерили линейкой. И тут проблема даже не в том, что мы не доверяем всем своим сотрудникам или сотрудникам наших подрядчиков. Просто критично не хватает ясности в этом процессе, прежде всего – реальных документальных подтверждений того, что действительно что-то измерялось.
Современный подход
Мы разработали специальный алгоритм, который на основе фотографии при помощи нейросети не только определяет количество бревен и диаметр каждого бревна (тоже важный для нас показатель) и считает тот самый коэффициент полнодревесности, но главное – берет его не из какого-то ГОСТа, а корректирует для конкретного штабеля лесопродукции.
Эти фотографии привязаны к геолокации автомобиля и хранятся в специальной базе. Поэтому после мы всегда можем взять и сверить: действительно ли был этот лес и сколько именно его было. Планы на ближайшие пару месяцев – обучить систему, чтобы она по эвристическому поиску умела автоматически сравнивать выезжающую и приезжающую машины. Сначала система фотографирует машину, когда та выезжает с делянки из леса, потом второй раз, когда та уже приезжает на комбинат. Далее она автоматически сверяет фотографии и фиксирует, не сняли ли сверху часть бревен и не подменили ли их. Такой автоматический контроль на базе искусственного интеллекта. Это значительно упрощает работу, например, службы безопасности, потому что бегать по всем лесам России (а у нас лесосека почти восемь миллионов гектаров!) мы не можем, как не можем и контролировать каждого лесоруба, потому что это дорого и неэффективно.
Когда мы пытались внедрить систему вместе с компанией, делавшей пилотный проект, то начали с Telegram-бота, чтобы продемонстрировать возможности данного алгоритма.

Кстати, этот Telegram-бот до сих пор есть.
Основные проблемы и их решение
Мы столкнулись с базовыми проблемами, с которыми сталкиваются все компании, которые внедряют искусственный интеллект, либо связанные с ним проекты. Во-первых, вопрос бюджета – откуда взять деньги. Во-вторых, вопросы обоснования стоимости. В-третьих, самый крупный блок проблем – закупочные процедуры и тендеры.
Для себя мы решили эту проблему следующим образом: в закупочных процедурах у Segezha Group есть так называемые «Пилотные проекты». Если мы хотим внедрить что-то новое и небольшое, к тому же ранее неописанное, нет необходимости придумывать ТЗ. Мы ведь еще не знаем, как это будет работать, поэтому сочинять соответствующее ТЗ – только зря тратить время. На подобные проекты есть определенный бюджет, и по решению закупочной комиссии абсолютно официально можно выбрать одного из подрядчиков. Таким образом, наша компания работает в духе некоего стартапа. Мы готовы терять эти деньги, но зато можем пробовать решить конкретную проблему.
Мой коллега, вице-президент Segezha по ИТ, на одном из форумов рассказывал про один из таких наших проектов: тот стоил несколько миллионов рублей, но мог при этом принести порядка трехсот миллионов. Мы рискнули, сделали «пилот» и он в итоге окупился многократно – может быть, не в сто, но как минимум в десятки раз точно. Очевидно, такие эксперименты несут и потери, но пробовать можно и нужно, потому что любой реализованный кейс – это очень ценный опыт. Использование технологий, проработанных в конкретных бизнес-проблемах, приносит свои плоды. Но тут надо и меру знать тоже – не стоит искусственный интеллект и машинное обучение внедрять везде, лишь бы только внедрить.
Еще один внутренний лайфхак: мы договорились с коллегами (с финансистами, закупщиками и руководством компании), что часть денег, которые нам подобные проекты приносят, в будущем будем реинвестировать в новые пилотные проекты – то есть будем постоянно вкладывать сэкономленные деньги в новые технологии и тем самым продвигать подобные истории в Segezha.

Сейчас мы как раз заканчиваем пилотирование «древесного» кейса. Чтобы было понятно по экономическим эффектам: погрешность способа измерения обычной линейкой по ГОСТу составляет 5%, но по факту она намного больше. Segezha Group в год примерно заготавливает и покупает древесины на 15 миллиардов рублей. Даже если взять 1% от этой суммы, это существенные потери. И подобные проекты, которые при этом не стоят миллиарды и даже сотни миллионов рублей, позволяют данные зоны риска закрывать. Может быть тут нет прямого экономического эффекта (то есть мы не станем зарабатывать больше или у нас не появится нового производства), но с точки зрения предотвращения возможных потерь в лесозаготовке очевидна довольно высокая эффективность.
Думаю, многим интересны сроки изготовления таких прототипов и хочется более конкретных цифр. Цифры по понятным причинам назвать не смогу, но обозначу самый проблемный момент – это получение релевантных данных. Например, какую фотографию или какие данные взять для ��бучения нейросети? Мы же не можем использовать результаты ручных измерений (те самые обмеры линейкой), потому что тогда алгоритм будет работать на некорректных данных. Приходится брать каждый лесовоз и делать так называемую «точковку»: бревна полностью выгружаются из лесовоза и каждое замеряется по диаметру и длине. Таким образом можно определить достоверный объем всей древесины с минимальной погрешностью. Еще одна особенность в том, что древесина бывает разная: сосна, ель, лиственница… Соответственно, у каждой свои особенности в измерении. Чтобы все намерить, моим сотрудникам приходилось ездить по разным регионам – в Киров, Архангельскую область, Красноярск, Карелию – и замерять там каждый лесовоз. Так что основное время (около двух недель) ушло на то, чтобы собрать достаточно репрезентативную выборку для обучения модели.
Автор: Дмитрий Бочаров, вице-президент по внутреннему контролю и аудиту в Segezha Group
