Как стать автором
Обновить

В НИУ ВШЭ разрабатывают технологию идентификации текстов, сгенерированных ИИ любого типа

Время на прочтение2 мин
Количество просмотров1.3K

Учёные НИУ ВШЭ работают над созданием приложения, которое позволяет установить, написан текст человеком или сгенерирован искусственным интеллектом. Подход, на который опирается приложение, носит универсальный характер и позволяет «ловить» самых разных ботов, построенных на разной архитектуре, сообщили в вузе.

Развитие технологий искусственного интеллекта привело к тому, что объём текстов, сгенерированных ИИ, увеличивается лавинообразно. При этом тексты, которые генерируют боты, сегодня уже сложно отличить от тех, которые пишут люди.

Проект «Поймай бота: семантические пространства дополненного ума» реализуют в рамках стратегического проекта НИУ ВШЭ «Устойчивый мозг: нейрокогнитивные технологии адаптации, обучения, развития и реабилитации человека в изменяющейся среде».

«Наша разработка отличается от разработок конкурентов. Подавляющее большинство аналогичных проектов посвящено задаче идентификации конкретных архитектур генеративных языковых моделей (к примеру, ChatGPT). Это приводит к неизбежному устареванию таких наработок по мере развития инструментов генерации текстов и (или) возникновения новых типов ботов, а также вынуждает потенциальных потребителей использовать на практике сразу несколько моделей, ответственных за обнаружение ботов с различными архитектурами. Мы „ловим“ всех ботов, а не только одного или нескольких, находящихся в нашем распоряжении», — рассказывает руководитель проекта Василий Громов, профессор департамента анализа данных и искусственного интеллекта факультета компьютерных наук НИУ ВШЭ.

Разрабатываемая система опирается на несколько различных областей математического знания: теория хаотических динамических систем, топологический анализ данных, теория размерности, теория кластеризации (четкой и нечеткой), нейронные сети и др. Это обеспечивает робастность системы: бот может «подделать» одну или даже несколько характеристик, но «подделать» их все крайне трудно.

В ближайшее время запланировано тестирование прототипа в широком диапазоне текстов: от художественных произведений, сгенерированных ботами, до выпускных конкурсных работ студентов НИУ ВШЭ. Планируется, что широкому кругу пользователей платформа будет доступна в 2025 году. Сначала она сможет «ловить» ботов на русском и английском языках, но учёные уже работают над увеличением числа языков, с которыми может взаимодействовать система. Это прежде всего языки стран БРИКС и языки народов России.

Теги:
Хабы:
+5
Комментарии19

Другие новости

Истории

Работа

Data Scientist
84 вакансии

Ближайшие события