Как стать автором
Обновить

Комментарии 6

И сколько же пришлось осмотреть вагонов, чтобы собрать тренировочный датасет? И если все они спокойно себе ездили до проверки, может не такие уж и неисправные они были? :)

С помощью статистического анализа мы определили количество наблюдений, которое нам нужно получить, чтобы проверить нашу гипотезу - и в данный момент набрали несколько сотен наблюдений.
Каждый вагон из этих сотен был осмотрен вживую по нашим рекомендациям. И в них действительно были обнаружены неисправности с некорректной сборкой тележки.

Значит размер всего датасета получится в районе тысячи? Для классификатора "к клиенту/в ремонт" наверное норм, но для регрессионного анализа кажется маловато данных...

Можно отметить два фактора для ответа на ваш вопрос

1. Мы не останавливаем сбор датасета – наша текущая модель по-прежнему будет формировать рекомендации по осмотру, и ее результаты будут фиксироваться,

2. Мы действительно сейчас решаем задачу классификации об определении наличия неисправности, а не регрессии.

Что алгоритм делает - непонятно, какие данные обрабатывает - неизвестно, на основе чего работает - покрыто тайной. Но вагоны и новые победы - это да.

Данные были подробно описаны в нашей предыдущей статье про этот проект. На сети РЖД размещены датчики, которые собирают информацию о техническом состоянии колесных пар вагонов. Они включают в себя два измерения: толщину обода и толщину гребня.

Наш алгоритм в данный момент осуществляет две задачи: предобрабатывает эти данные и формирует на их основе рекомендации по ремонту вагонов. Рекомендации направляются в пункты обслуживания вагонов для проверки их корректности и для осуществления ремонтов, если вагон действительно неисправен.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий