Как стать автором
Обновить

Нейросеть, разработанная российскими учеными, научилась определять возраст по видео с высокой степенью точности

Время на прочтение3 мин
Количество просмотров3.8K


В авторитетном научном издании Journal of Physics опубликована статья, в которой описываются результаты работы по созданию нейросети, определяющей возраст и пол человека.

Разработчики, о которых идет речь, реализовали свой проект в Высшей школе экономики под руководством Андрея Савченко. Команда предложила новый метод анализа данных человека по видео, этот метод заложен в основу работы нейросети, которая относится к классу сверточных.

Сам метод заключается в покадровом анализе видео, с выделением на отдельных фреймах человека. Далее анализ идет в двух направлениях. Первое позволяет определить средний возраст человека, второе — его пол. Как обычно, нейросеть изначально обучали, база видео, которая послужила основной обучения, включает 1165 видео.

Авторы указывают, что их нейросеть может определять возраст человека с точностью около 71%, пол — 88%. Свою разработку авторы планируют использовать для создания мобильного приложения под Android.

Новшество разработки заключается в том, что нейросеть научили работать с видео. Что касается изображений, нейросети уже давно умеют определять возраст и пол человека — и точность работы систем в этом случае достаточно велика. Но если нужно работать с видео, то задача усложняется, поскольку выделить четкий кадр с человеком, где бы хорошо было видно его лицо не так просто.

В стандартной схеме используется оценка возраста человека от 0 до 100 лет, затем идет анализ всей возрастной шкалы с указанием вероятности того, что человеку на изображении именно столько лет. Например, вероятность его принадлежности к возрастной группе 25-30 лет 10%, 30-35 — 35%, а, скажем, 50-55 лет — 60%.



Алгоритм реализован на базе IDE Pycharm с Python 3.6. Много ресурсов такой нейросети не нужно — тесты проводились на обычном десктопном ПК с Intel Core i5-2400 CPU, видеокартой NVIDIA GeForce GT 440 и 64-х битной ОС Windows 7. Кроме того, тестировалась система и на мобильном устройстве с Android OS (версия Android и характеристики мобильного устройства не указаны).


Предполагаемый графический интерфейс приложения Android

Что касается мобильного приложения, то его главный элемент — окно с демонстрацией видео (захват с камеры). Нейросеть анализирует отдельные кадры и пытается указать возраст и пол человека.

По словам разработчиков, основная проблема в распознавании различных характеристик человека, включая его возраст и пол в том, что обучение нейросетей, которые специализируются на этой задаче, слишком ограничено. Базы данных видео и изображений относительно невелики, а ведь все люди очень разные, включая представителей одного пола и возрастной категории.

Интересно, что одна из баз данных, на основе которой проводилось обучение нейросети из статьи в том, что все видео были вырезаны из индийских фильмов. Всего в базе было 322 различных видео с 34512 фреймами. На видео содержались сцены с участием сотен индийских актеров. Их для удобства разделили на 4 возрастных категории: «Дети», «Юношество», «Средний возраст», «Пожилые». Что касается временной шкалы, то это 1-12 лет, 13-30, 31-50, 50+.

Нейросети могут определять пол и возраст человека не только по фотографиям или видео лица или тела. К примеру, нейросеть, созданная Google и Verily научилась узнавать не только указанные характеристики, но еще и среднее содержание сахара в крови HbA1c, индекс массы тела BMI, артериальное систолическое давление SBP, артериальное диастолическое давление DBP. А еще система указывает, курит человек или нет. И все это — по снимку глазного дна.



Для обучения этой нейросети разработчики воспользовались базой изображений, в которой содержалось около 300 000 фотографий. Информацию предоставили EyePACS и UK Biobank. По мнению медиков, новый подход к диагностике может помочь врачам быстрее ставить диагноз. ИИ в состоянии не только ускорить, но и увеличить точность диагностики. Медикам просто необходима эта помощь, поскольку врач-человек не всегда в состоянии работать быстро и эффективно, особенно в конце рабочего дня. В итоге страдает точность диагностики и корректность назначенного курса лечения.
Теги:
Хабы:
Если эта публикация вас вдохновила и вы хотите поддержать автора — не стесняйтесь нажать на кнопку
Всего голосов 22: ↑13 и ↓9+4
Комментарии9

Публикации