Комментарии 17
Отличная статья! Спасибо!
НЛО прилетело и опубликовало эту надпись здесь
Интересно, не является ли ad hoc редакция выходных данных читерством?
Если вы про умножение ответов на константы, то читерством это не является. Но и для компании, проводящей соревнования, ценности такая подгонка под ответ никакой не несёт. outrunner потом сам признался, что он тупо и методично оверфитился на паблик либерборд.
нет, private тестирование проводится (обычно) на данных, которые не давали для обучения, как следствие, если вы смогли подобрать такую эвристику, которая работает отлично на неизвестных данных, то это и есть решение :)
В этом случае просто повезло, что распределения public/private были очень близки.
Ну, я о том, что если эвристика постфактум меняет результат подсчета, то это и не подсчет вовсе, а в задаче запрос стоял именно подсчитать.
Присобачил в конце выходной слой для регрессии на 5 классов сивучей. Каждый выходной нейрон предсказывал количество особей соответствующего класса.Можно поинтересоваться, как в таком случае выглядела loss-function?
Ну и с Вашей точки зрения — хоть какие-то из решений могут использоваться в будущем? Насколько хорошо получилось (субъективно)?
Loss-function — квадрат L2 расстояния между двумя 5-мерными векторами (предикты и ground truth).
Субъективно. Если поменять локацию/угол/высоту съёмки, то все решения из топа сразу станут давать совсем другие ответы (скорее всего неверные). Если их дроны всегда будут летать примерно на той высоте, на которой были сняты снимки для трейна, то топовые решение дают не такую уж и плохую оценку числа особей (RMSE от 10 до 15 на 1 снимок в среднем). Хотя, не понятно, является ли такая ошибка на одном снимке значительной для биологов.
Субъективно. Если поменять локацию/угол/высоту съёмки, то все решения из топа сразу станут давать совсем другие ответы (скорее всего неверные). Если их дроны всегда будут летать примерно на той высоте, на которой были сняты снимки для трейна, то топовые решение дают не такую уж и плохую оценку числа особей (RMSE от 10 до 15 на 1 снимок в среднем). Хотя, не понятно, является ли такая ошибка на одном снимке значительной для биологов.
Мы (5е место) пытались сделать честное решение без подгонки к ледерборду.
Я реализовал оценку масштаба используя статистику SSD boxes -> xgboost -> image scale, потом считал количество как просто интеграл хитмапов при квадратиках равной площади ground trooth.
Я реализовал оценку масштаба используя статистику SSD boxes -> xgboost -> image scale, потом считал количество как просто интеграл хитмапов при квадратиках равной площади ground trooth.
Скажите, а ваш алгоритм сможет отличить рядовых от офицеров, русских от китайцев на поле боя?
а вы обучали веса Inception-Resnet-V2, VGG с нуля или брали их с весами? или брали с весами и дообучали? или брали с весам и часть замораживали, а часть дообучали?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Kaggle: как наши сеточки считали морских львов на Алеутских островах