Как стать автором
Обновить
82.09
Первая грузовая компания (ПГК)
Крупнейшая цифровая логистическая компания на ж/д

Data Science для «неайтишных» компаний. Как организовать работу направления с «нуля»?

Время на прочтение5 мин
Количество просмотров3.2K
ru.freepik.com
ru.freepik.com

Сегодня большинство компаний идут по пути цифровой трансформации, внедряют новые методы работы и организации процессов. Частью этой трансформации обычно становится Data Science, ведь сложно себе представить «цифру» без предиктивной аналитики и возможностей, которые она дает. Меня зовут Надежда Костякова, я руковожу управлением анализа данных и машинного обучения в Первой грузовой компании (ПГК). Я расскажу о том, как мы начинали работать с направлением Data Science. Надеюсь, этот опыт будет полезен и специалистам, и компаниям, которые, как и мы, находятся в начале пути.  

В чем особенность внедрения DS в «неайтишных» компаниях?

Цифровая трансформация для «неайтишных» компаний – промышленных, транспортных и других тяжелый процесс, в котором нужно разработать и внедрить новые, часто основанные на аналитике данных, продукты. Нам приходится с «нуля» выстраивать процессы и стандарты разработки. Кроме того, бизнес-подразделения компании часто не готовы к изменениям и воспринимают их в штыки. От DS ждут быстрых результатов и разочаровываются, когда этого не происходит. Поэтому важны поддержка руководства, продуманная стратегия действий и информирование о процессе внедрения.

Этап 1. DS в компании нет, разрозненные знания

Область железнодорожных перевозок традиционно считается консервативной, бюрократичной и мало подверженной изменениям: нет нужды что-то менять, если спрос на услуги будет в любом случае (почти 80% грузов в нашей стране могут перевозиться только по железной дороге). Однако сейчас конкуренция между логистическими компаниями во всех видах транспорта усилилась. Работать как раньше уже нельзя. Именно поэтому ПГК активно развивает ИТ-направление и внедряет систему управления данными. Мы разрабатываем собственные внутренние системы для организации производственного процесса.

Сначала анализ данных проводили несколько привлеченных специалистов по стандартам, которые они привносили извне как «лучшие практики». При таком подходе не было установленного процесса разработки, версионирования кода и моделей. Тогда это полностью устраивало всех участников процесса: когда не знаешь, как надо, сложно что-то рекомендовать.

Этап 2. Найм специалистов, появление компетенций, необходимость структурировать и организовать процесс, код, инфра

ru.freepik.com
ru.freepik.com

В определенный момент мы начали разрабатывать внутренние продукты, в которых потребовалось привлечение специалистов по анализу данных в штат. Появилась внутренняя компетенция, «лучшие практики» уже сложно было навязать, потому что у каждого нового сотрудника был свой опыт в других компаниях, да и не все бенчмарки нам подходили.

Кроме того, появилась потребность обмениваться кодом, датасетами и моделями. Уже нельзя было разрабатывать и запускать что-то локально. Нужно было построить системную работу.

И тут сложным оказался процесс управления навыками сотрудников. Каждому из них требуется постоянное развитие своих компетенций. Мне как руководителю надо было найти баланс в этом развитии – чтобы и сотрудник был доволен и компании была польза.

Этап 3. Поиск решения: разрозненные действия, матричная структура, формирование стандартов, локальный ассесмент

Мы начали формировать и укреплять команду. Была сформирована база знаний Data Scientist’ов, в которой описывались:

1.     стандарты удаленной разработки: стандарты подключения к удаленным серверам, стандарты подключения к базам, стандарты версионирования и написания кода;

2.     описание всех проектов, связанных с анализом данных, в виде отчетов, понятных бизнесу и специалистам;

3.     матрица компетенций для каждого сотрудника, в которой были проставлены оценки по каждой области знаний;

4.     ссылки на обучающие материалы и конференции.

ru.freepik.com
ru.freepik.com

Причем матричная система организации, где каждый специалист подчиняется одновременно своему проектному руководителю и руководителю центра компетенций, дала возможность внедрять эти практики максимально широко. Тесные контакты Data Scientist’ов друг с другом позволяли соблюдать стандарты и расширять их использование в проектах.

Этап 4. Новые проблемы: найм еще большего количества специалистов, кросс-функциональное взаимодействие, разные уровни знаний, обмен опытом

Команда специалистов продолжала расти: в ПГК видели потребность в запуске и развитии новых цифровых продуктов. Мы уже писали о наших проектах: Личном кабинете клиента, приложении «Мобильный репортер», проекте «Цифровой вагон». Если еще не читали, то обязательно посмотрите в блоге ПГК публикации. И это далеко не все, над чем мы работаем.  

Процесс расширения штата внутренних сотрудников больше не позволял так плотно обмениваться накопленным опытом. Зачастую люди работали на разных продуктах и не общались друг с другом каждый день. Их единственным связующим звеном оставался руководитель.

Кроме того, все более сложная архитектура внутренних продуктов сформировала потребность в углублении компетенции по промышленной разработке моделей. Необходимо было выработать процессный стандарт, которого все могли бы придерживаться.

Тогда мы заметили еще одно пространство для улучшений: матрица компетенций больше не служила той цели, которая перед ней стояла. Она давала информацию что развивать, но не позволяла понять, как это сделать. По сути она стала рудиментом.

Этап 5. Новые решения: обмен опытом, формирование карьерных треков, партнерства, разработка стратегий PR

Тогда мы придумали новые решения. Большим достижением для нас стал запуск площадки по обмену знаниями сотрудников: каждый, кто хотел рассказать о том, что знает, теперь мог это сделать.

Можно задать логичный вопрос: зачем сотруднику тратить время на подготовку, когда на нем висят задачи по проектам? Есть несколько причин на это:

1.     Многие люди любят делиться тем, что они знают и умеют, некоторые люди даже предрасположены к этому;

2.     На время подготовки к сессии по обмену знаниями сотрудник освобождается от своих оперативных задач;

3.     Человек получает возможность и площадку для обсуждения вопросов, которые его волнуют.

Эта инициатива сработала: мы повысили прозрачность процессов по анализу данных и осведомленность сотрудников о «лучших практиках», дали возможность обсудить проблемы, с которыми они сталкиваются в процессе работы. К тому же площадка сблизила людей.

ru.freepik.com
ru.freepik.com

Вторым большим достижением стала разработка унифицированного процесса выведения моделей в промышленную эксплуатацию. Когда люди сталкиваются с одними и теми же проблемами, которые постоянно обсуждаются, появляется возможность выстроить неплохой процесс. Повышение осознанности – ключ к совершенствованию.

Кроме того, мы начали внедрять прозрачные карьерные треки. Это касается не только нашего подразделения, однако мы стали одними из первых в компании, развивающимися в этом направлении. В чем ключевое отличие от матрицы компетенций? Кроме оценки навыков сотрудников, карьерный трек дает возможность и ссылки на то, где недостающие знания можно приобрести. И, более того, мы даем возможность обучаться за счет компании на тех курсах, которые способствуют их индивидуальному развитию. Есть также возможность посещения платных конференций.

Последним пунктом можно назвать подключение всех сотрудников, ответственных за цифровую трансформацию, к корпоративной обучающей платформе. Она позволяет всем людям ознакомиться с базовыми принципами и подходами к анализу данных, чтобы более ясно понимать, где мы можем применить машинное обучение и какие ограничения у него есть.

Сейчас мы значительно продвинулись в развитии нашего центра компетенций: собрали отличную команду увлеченных специалистов, настроили процессы обмена знаниями и повышения опыта, стандартизируем подход к разработке. Но путь наш далек от завершения. Одной из ключевых задач, которую предстоит решить, является отсутствие ML-платформы, позволяющей каждому специалисту встроиться в существующие стандартизированные процессы с минимальными затратами.

Надеюсь, наш опыт покажет и другим компаниям, заинтересованным в развитии направления анализа данных, как можно начать свой путь, и поможет избежать части ошибок. О развитии нашего подразделения расскажем в следующих статьях.

Теги:
Хабы:
Всего голосов 5: ↑4 и ↓1+3
Комментарии4

Публикации

Информация

Сайт
pgk.ru
Дата регистрации
Дата основания
Численность
1 001–5 000 человек
Местоположение
Россия