belinskiynv 2 дек 2019 в 17:27

Ищем аномалии и предсказываем сбои с помощью нейросетей

11 мин

14K

Блог компании НПО КристаМашинное обучение*DevOps*Искусственный интеллект

Комментарии 4

lekzar 3 дек 2019 в 15:49

Интересно, сколько человеко-часов ушло на MVPшку

belinskiynv 3 дек 2019 в 16:28

честно говоря не считал человеко-часы. Могу сказать только что на действительно нужные вещи (концепция + софт) ушло не так уж много времени (около пары месяцев). Так как экспериментальная программа и сама работа были частью моей магистерской диссертации, большее количество времени пришлось слить на документацию и всякие условные вещи требуемые для защиты магистерской.

Vinchi 9 дек 2019 в 03:45

с автокодировщиками есть такая беда — высокий риск переобучения. В итоге на трейне все норм, а на валидации ошибка начинает нарастать с каждой эпохой. Как подбирали параметры? Какие ошибки восстановления использовали? Что нибудь кроме квадрата разницы может быть? Расскажите плиз больше про архитектуру вашего автоэнкодера и подбор параметров под задачу.

belinskiynv 10 дек 2019 в 10:47

По поводу автокодировщика и его архитектуры, брали идею отсюда. Синхронный автокодировщик, он же в англоязычном варианте — LSTM autoencoder. Параметры из разряда размера окна, % аномальности и.т.д подбирали вручную прогоняя на тестовом датасете. Ошибку реконструкции — использовали MSE, что бы по другому определяли не находил. По поводу переобучения, была самая большая запара. Решали как описано тут (ссылка). Данный метод использования автокодировщика сильно зависит от специфики данных. По большому счету нам повезло и более менее успешное применение автокодировщика связанно с особенностями наших данных. Количество данных, регламент использования системы, особенности системы — все это повлияло на результат. Конечно стоит понимать, что не обошлось без небольших доработок и подгонок конкретно под наши данные, но там уж совсем специфично.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий