Как стать автором
Обновить

Исследователи создали алгоритм, способный определить депрессивное состояние по постам в Twitter

Время на прочтение2 мин
Количество просмотров878

Исследователи из Лондонского университета Брунеля и Лестерского университета разработали алгоритм, анализирующий посты пользователей в Twitter на предмет наличия признаков депрессии. Его обучали на базе данных, содержащей историю тысяч пользователей Twitter вместе с информацией об их психическом здоровье. Из обучения и итоговых тестов были исключены аккаунты с менее чем пятью твитами.

В начале работы бот запускает сканирование на предмет наличия ошибок и аббревиатур. После их поиска и расшифровки начинается анализ постов. Программа учитывает 38 различных факторов, среди которых количество твитов, частота употребления ключевых слов, количество друзей, частота использования смайликов, количество ретвитов, упоминаний, лингвистические особенности текста, время публикации и не только. 80% собранной базы данных использовалось для обучения бота, оставшиеся 20% — для его тестирования.

Исследователи утверждают, что смогли добиться 88,39% точности в определении признаков депрессии с использованием собственной базы Tsinghua Twitter Depression Dataset.

Исследование авторов не доступно для бесплатного просмотра, но на arXiv сохранился препринт материала. Ниже представлена схема работы программы, представленная в препринте. Первый этап выделен красным. В нём программа проводит обработку данных и извлекает ключевые характеристики пользователей Twitter. На втором этапе инструмент Cost-sensitive Boosting Pruning Trees (CBPT) проводит классификацию пользователей по обнаруженным характеристикам. Сам алгоритм классификации построен на AdaBoost.

По словам авторов, инструмент можно адаптировать для анализа пользователей с практически любых социальных платформ. Они предлагают использовать его не только для обнаружения ранних признаков депрессии у отдельных пользователей, но и для проведения расследований, анализа массовых настроений и не только.

Следующим шагом будет изучение эффективности бота при различных условиях. Кроме того, разработанную технологию классификации могут интегрировать в приложения в сферах электронной коммерции, проведения собеседований или поиска кандидатов. Инструмент может быть потенциально полезен работодателям для предварительного анализа состояния человека по его сообщениям в соцсетях.

Публикация — Lei Tong et al, Cost-sensitive Boosting Pruning Trees for depression detection on Twitter, IEEE Transactions on Affective Computing (2022). DOI: 10.1109/TAFFC.2022.3145634ieeexplore.ieee.org/document/9691852

Препринт с подробностями — Cost-sensitive Boosting Pruning Trees for depression detection on Twitter

Теги:
Хабы:
Всего голосов 1: ↑1 и ↓0+1
Комментарии3

Другие новости