Компания Fujitsu и её американское подразделение в сотрудничестве со Школой компьютерных наук Университета Карнеги-Меллона разработали технологию распознавания выражения лица на основе ИИ.
«Технология может точно обнаруживать едва уловимые эмоциональные изменения, в том числе нервную улыбку, замешательство и т. д. Fujitsu рассчитывает, что новая технология найдет применение в различных приложениях, связанных в том числе с безопасностью», — объявлено в пресс-релизе.
Как отмечают в компании, технологии, связанные с обнаружением изменений выражения лица и «чтением» человеческих эмоций, в основном, были разработаны для обнаружения явных изменений — таких как широкая улыбка или широко раскрытые глаза. Чтобы эффективнее «читать» человеческие лица, важно фиксировать тонкие изменения, связанные с такими эмоциями, как непонимание, недоумение и стресс, уверены в Fujitsu.
Для достижения этой цели разработчики в компании использовали так называемые единицы действия (Action Units, AU), которые соответствуют определённому движению каждой мыщцы лица. Существует приблизительно 30 типов AU на основе движений каждой лицевой мышцы. Например, если ИИ замечает одновременно два AU — «движение щеки вверх» и «подъём угла губ», — ИИ может сделать вывод, что человек рад.
«Интегрировав эти AU в свою технологию, Fujitsu смогла добиться обнаружения даже незначительных изменений в выражении лица», — утверждают в компании.
Чтобы обнаруживать AU с большей точностью, базовые методы глубокого обучения требуют больши́х объемов данных. Однако в реальных ситуациях камеры обычно фиксируют лица под различными углами и с разного расстояния, что затрудняет создание действительно обширных баз данных для обучения.
«Проблема с нынешней технологией заключается в том, что ИИ должен обучаться на огромных наборах данных для каждого AU. Он должен знать, как распознавать тот или иной AU со всех возможных углов и позиций. Но мы не делаем этого», — заявил представитель Fujitsu в комментарии изданию ZDNet.
В процессе обучения искусственного интеллекта Fujitsu разработала технологию адаптации для каждого изображения лица. Например, когда лицо сфотографировано под углом, технология может подстраивать изображение, чтобы оно больше походило на фронтальное. С помощью этой технологии фотографии лиц поворачиваются, увеличиваются или уменьшаются. Это позволяет обучать ИИ, располагая относительно небольшим объемом данных.
Как утверждают в Fujitsu, новая технология достигла высокой точности распознавания выражения лиц — 81% даже при ограниченных данных для обучения.
Подобной технологией, как пишет Unirobotica, владеет и Microsoft. Однако ее инструмент ИИ способен распознавать только восемь основных эмоций — гнев, презрение, страх, отвращение, счастье, печаль, удивление или нейтральное выражение лица. При этом точность определения эмоций у инструмента Microsoft составила 60%.