Комментарии 8
Yolov4 и darkent от Alexeyab попробуйте. На похожей задаче(каски на строителях) были неплохие результаты.
Смотрите, VGG — это очень жирная архитектура. Плюс, ваш подход поиска мяча будет очень нестабилен как только камера попадёт в другой зал, как только будет меняться освещение, камера, форма игроков, и.т.д.
Вашу задачу сильно проще решать через детекцию нейросетью + трекинг того что задетектированно. Сейчас существует очень много подходов которые это реализуют (более полно я их тут освещал). Скорее всего вам будет достаточно самого обычного Sort, который подключается одной строчкой.
В качестве детектора действительно неплохо брать YoloV4, но он будет работать на хороших вычислителях. Если у вас слабое устройство, то легче использовать Tiny Yolov4. Про всё это дело хорошая статья на Хабре есть.
Сейчас достаточно много неплохих архитектур, в целом с вашей задачей любая справиться.
Вашу задачу сильно проще решать через детекцию нейросетью + трекинг того что задетектированно. Сейчас существует очень много подходов которые это реализуют (более полно я их тут освещал). Скорее всего вам будет достаточно самого обычного Sort, который подключается одной строчкой.
В качестве детектора действительно неплохо брать YoloV4, но он будет работать на хороших вычислителях. Если у вас слабое устройство, то легче использовать Tiny Yolov4. Про всё это дело хорошая статья на Хабре есть.
Сейчас достаточно много неплохих архитектур, в целом с вашей задачей любая справиться.
Очень интересно, спасибо
Мне кажется, проще задачу будет решать на данных с разных ракурсов. При съемке сзади фигуры игроков будут здорово закрывать обзор и полной картины розыгрыша, особенно в защите, не получить. Да и мяч будет проще отделять, сличая «показания» двух датасетов. Понятно, что одна точка обзора — специфика данного датасета, но насколько я читал, в футболе подобные задачи очень помогала решать камера сверху. Может лучше направить усилия на поиск подходящего датасета? :)
Камера и ракурсы — это очень интересный вопрос. Я смотрел разные источники и в каждом свои нюансы. Например, для ТВ камера динамическая, а в ряде волейбольных лиг запись идёт сзади, как в этом примере ( возможно, есть вторая камера с другой стороны). Видел ролики с камерой на стойке, но она не захватывает края поля.
В общем, вариантов много и "подходящего" на все случаи жизни скорее всего нет.
Другой вопрос — юридическая частота датасета. В VK и на Ютубе полно материала, но все это кому-то принадлежит, и не хочется, чтобы всю статью забанили по чьей-нибудь жалобе.
НЛО прилетело и опубликовало эту надпись здесь
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Распознавание мяча в волейболе с OpenCV и Tensorflow