Комментарии 3
Посмотрите, распознавание мигает, два соседних кадра, один 100% определяет, а соседний, отличающийся не значительно, уже нет.
Что бы это решить, а так же по той причие, что у вас маленький датасет, вы можете собрать его автоматически, вот на основе таких ошибочных случаев, берете соседние кадры, тот что распознался и тот что нет, и добавляете в обучающую выборку.
Так же в выборку нужно добавить равное по объему случаи где нет жестов но есть рука, это так же можно сделать в авторежиме, просто рукой жесты не показываете. Еще момент, нужно в выборку добавлять кадры построения жеста рукой, те что еще не являются жестом но через несколько кадров таковым станут, так как текущая модель уже распознает жесты, берете кадры ДО этого момента и добавляете в выборку.

От идеи к реальности: как я собрал свой первый пет-проект по распознаванию языка жестов