Отдельной логики обработки тени сейчас нет, может быть удастся обойтись без этого.
Ресайз вдвое — легко режет и мяч, особенно когда он на дальнем плане и фон не сильно контрастный.
Тень отсекается, если выбрасывать вогнутые параболы.
Вообще в шумоподавлении есть несколько уровней:
— геометрия, где отсекаются кандидаты нестандартных форм и размеров
— движение, где отсекаются случайные и статические кандидаты
— траектории, где отсекаются непараболические или неправильно ориентированные траектории
— семантика собственно волейбола (TBD) где отсекаются траектории, невозможные в игре
Тут такая штука — нельзя 100% подавить шумы и оставить только мяч. Он неминуемо давится вместе в шумами и в более жестком режиме короткие траектории идут под острел. Приходится искать баланс.
А не подскажете готовые эксперименты с кодом на подобную тему? На словах оно гладко, а когда я начинал копать примеры, так все время чего-то не хватало
>>Первой сетке на вход подаёте M пар двумерных координат где мяч был ранее разпознан
У меня уже есть параболическая траектория, это все считается без нейросети, но на порядки быстрее.
>>Вторую сетку делаете как YOLO4
В основе YOLO все равно лежит бинарный классификатор, если он не работает, то про детектор нет смысла говорить
>>Как вы глазами ищете самолёт в небе…
Воот, мозг знает какой то контекст, на основании которого он может распознать самолет. Нейросеть контекста не знает и любой кусок серого цвета может быть принят за самолет (и человек тоже не отличит, если не знает контекста)
Прикольно, я ковыряю похожую тему для волейбола (https://habr.com/ru/post/516448/), столько интересных идей у вас почерпнул (особенно про идентификацию)
Я тестировался на нескольких картинках, разница была примерно такая же. Эту выбрал для иллюстрации.
И YOLO и SSD показали достаточнные для меня результаты и весь вопрос был в скорости.
Какая то у yolo5 мутная репутация, не понятно чему верить.
На вход yolo4 подаю 400x400 (также ssd). Можно подать меньше, но вряд-ли разрыв изменится.
Спасибо, почитаю про остальные
Yolo настолько доминирует в информационном пространстве, что такой провал в сравнении с древней реализацией стал для меня большим сюрпризом.
Вы имеете в виду, что сама реализация DNN не быстрая?
Использованная yolo модель взята с их сайта без изменений и тренирована скорее всего по всем правилам даркнета (хотя свечку я понятно не держал).
О, спасибо, openvino как хорошо развился, несколько лет назад там было три модели.
Я честно говоря думал,что оно так и останется, как часто бывает у Интела.
>> Мобайлнет под процессоры больше заточен
Запускаются такие хобби-проекты на дешевых облаках, где Tesla 100 для Yolo явно не вариант.
А зачем здесь вобще про Спотифай?
Почему не "загрузка песен с Youtube"?
Ресайз вдвое — легко режет и мяч, особенно когда он на дальнем плане и фон не сильно контрастный.
Вообще в шумоподавлении есть несколько уровней:
— геометрия, где отсекаются кандидаты нестандартных форм и размеров
— движение, где отсекаются случайные и статические кандидаты
— траектории, где отсекаются непараболические или неправильно ориентированные траектории
— семантика собственно волейбола (TBD) где отсекаются траектории, невозможные в игре
Про ваш диплом — есть статья и код в открытом доступе?
У меня уже есть параболическая траектория, это все считается без нейросети, но на порядки быстрее.
>>Вторую сетку делаете как YOLO4
В основе YOLO все равно лежит бинарный классификатор, если он не работает, то про детектор нет смысла говорить
>>Как вы глазами ищете самолёт в небе…
Воот, мозг знает какой то контекст, на основании которого он может распознать самолет. Нейросеть контекста не знает и любой кусок серого цвета может быть принят за самолет (и человек тоже не отличит, если не знает контекста)
Как-то неконкретно..
Если бы минимальный пример с датасетом и кодом..