2022-й: а что в итоге? ТОП – 3 проекта, над которыми мы работали в этом году
ТОП – 3 проекта, над которыми мы работали в этом году
Соблюдаем традицию подводить итоги уходящего года. Несмотря на то, что у нас десятки проектов развиваются одновременно, мы решили рассказать о трех, но самых интересных. За каждым из них - большая команда, сотни рабочих часов, десятки гипотез и тестов.
ТОП – 3: Помогли создать самый большой датасет распознавания жестов
В этом году SberDevices представил в открытом доступе огромный датасет для распознавания жестов - HaGRID (Hand Gesture Recognition Image Dataset). Он может быть полезен при создании виртуальных помощников для тех людей, которые используют язык жестов.
В этом проекте мы как собирали, так и размечали данные на нашей платформе Elementary. Задача состояла в том, чтобы подготовить согласно инструкции достаточное количество качественных изображений, т.е. «данных», для дальнейшего обучений нейросетей.
Созданный SberDevices датасет состоит из 552992 элементов, разделённых на 18 классов. То есть в каждом из них примерно по 30 тысяч фото. Изображения — RGB-картинки, преимущественно FullHD (~91% датасета). На них представлены реальные люди, показывающие жесты на камеру. Количество уникальных пользователей в датасете — не менее 34700, при этом набор данных содержит как минимум столько же разнообразных сцен с людьми (различное освещение, расстояние до камеры и положение кистей относительно человека). Датасет в равных пропорциях распределён по полу (число женщин лишь немногим больше мужчин), а возраст исполнителей — от 18 до 60 лет.