Группа швейцарских учёных из Женевского университета разработала систему автоматизированного анализа видео для диагностики ранних стадий аутизма у детей до пяти лет. Система правильно определяет наличие расстройства в 80 % случаев, ориентируясь на то, как дети играют со взрослыми на десятиминутном видео.

Аутизм развивается вследствие нарушений в развитие головного мозга. Он характеризуется выраженным и всесторонним дефицитом социального взаимодействия и общения, ограниченными интересами и повторяющимися действиями. Это расстройство диагностируют исключительно по поведению. Некоторые зачатки аутизма видны уже в очень раннем возрасте, тем не менее его очень сложно уверенно диагностировать у детей до пяти лет.
Учёные Женевского университета отмечают в своём исследовании, что чем раньше поставлен диагноз, тем быстрее и качественнее родители смогут компенсировать задержки в развитии ребёнка. Чтобы облегчить диагностику расстройства с первых дней жизни, авторы решили создать систему для анализа видео на основе машинного зрения, определяющую присутствие аутизма по движениям и взаимодействию рабёнка с окружающим миром.
Систему обучали на видео с 34 детьми с нормальным развитием и 34 детей с аутизмом в возрасте от 1,2—5,1 лет. Такие же группы детей были набраны для тестирования системы. Для проверки надёжности метода авторы включили дополнительную тестовую выборку из 101 видео с аутистами в возрасте 2,3—4,62 лет. Группа со здоровыми детьми прошла тщательное обследование на присутствие любых неврологических расстройств и расстройств аутистического спектра как у самих детей, так и у их ближайших родственников.
Оценка состояния проводилась с учётом возраста детей и их способности выполнять сложные когнитивные задачи. В ходе работы система опиралась на шкалу наблюдения для диагностики расстройств аутистического спектра ADOS-2. Она включает в себя пять модулей, охватывающих возраст 1—18 лет и различные языковые уровни, начиная от отсутствия выразительного использования слов и заканчивая беглым сложным языком. В данной работе авторы сосредоточились на модулях 1 и 2. Они направлены на оценку невербальных аспектов социального общения и взаимодействия.
Нейросеть основана на технологии машинного зрения OpenPose. Она формирует «скелет» человека на основе анализа двумерного изображения и отслеживает по нему движение объекта, отсекая все лишние факторы.

Исследователи не создавали конкретных сценариев для экспериментов. В рамках наблюдений дети свободно передвигались и играли со взрослыми. Кроме того, сам метод не требует установки датчиков или иных механизмов на детей или взрослых и может обеспечить полную анонимность, поскольку алгоритм не собирает дополнительные данные.
В итоге обученная нейросеть с точностью выше 80 % определяла наличие у детей расстройств аутистического спектра. При продолжительности видео в 10 минут точность определения составила 70 %. Авторы отмечают, что видео в исследовании были максимально разнородными — оценки проводились в разных комнатах и снимались разными системами камер.
Исследователи не планируют развивать систему до полной автоматизации постановки диагноза. Конечная цель авторов — создать эффективный вспомогательный механизм, способный обнаружить ранние паттерны расстройств аутистического спектра для дальнейшей тщательной диагностики специалистом-человеком.
В будущем авторы обратят особое внимание на невербальное взаимодействие детей. В частности, нейросеть будут учить различать частоту коммуникативных жестов, особенности общих аффективных состояний и нетипичные социальные проявления.
Материалы исследования опубликованы в статье «Using 2D video-based pose estimation for automated prediction of autism spectrum disorders in young children» в журнале Nature Doi.org/10.1038/s41598-021-94378-z.