LizzieSimpson 23 июл 2024 в 13:18

В НИУ ВШЭ разрабатывают технологию идентификации текстов, сгенерированных ИИ любого типа

2 мин

1.6K

Искусственный интеллектМашинное обучение*Научно-популярное

Учёные НИУ ВШЭ работают над созданием приложения, которое позволяет установить, написан текст человеком или сгенерирован искусственным интеллектом. Подход, на который опирается приложение, носит универсальный характер и позволяет «ловить» самых разных ботов, построенных на разной архитектуре, сообщили в вузе.

Развитие технологий искусственного интеллекта привело к тому, что объём текстов, сгенерированных ИИ, увеличивается лавинообразно. При этом тексты, которые генерируют боты, сегодня уже сложно отличить от тех, которые пишут люди.

Проект «Поймай бота: семантические пространства дополненного ума» реализуют в рамках стратегического проекта НИУ ВШЭ «Устойчивый мозг: нейрокогнитивные технологии адаптации, обучения, развития и реабилитации человека в изменяющейся среде».

«Наша разработка отличается от разработок конкурентов. Подавляющее большинство аналогичных проектов посвящено задаче идентификации конкретных архитектур генеративных языковых моделей (к примеру, ChatGPT). Это приводит к неизбежному устареванию таких наработок по мере развития инструментов генерации текстов и (или) возникновения новых типов ботов, а также вынуждает потенциальных потребителей использовать на практике сразу несколько моделей, ответственных за обнаружение ботов с различными архитектурами. Мы „ловим“ всех ботов, а не только одного или нескольких, находящихся в нашем распоряжении», — рассказывает руководитель проекта Василий Громов, профессор департамента анализа данных и искусственного интеллекта факультета компьютерных наук НИУ ВШЭ.

Разрабатываемая система опирается на несколько различных областей математического знания: теория хаотических динамических систем, топологический анализ данных, теория размерности, теория кластеризации (четкой и нечеткой), нейронные сети и др. Это обеспечивает робастность системы: бот может «подделать» одну или даже несколько характеристик, но «подделать» их все крайне трудно.

В ближайшее время запланировано тестирование прототипа в широком диапазоне текстов: от художественных произведений, сгенерированных ботами, до выпускных конкурсных работ студентов НИУ ВШЭ. Планируется, что широкому кругу пользователей платформа будет доступна в 2025 году. Сначала она сможет «ловить» ботов на русском и английском языках, но учёные уже работают над увеличением числа языков, с которыми может взаимодействовать система. Это прежде всего языки стран БРИКС и языки народов России.

Хабы:

В НИУ ВШЭ разрабатывают технологию идентификации текстов, сгенерированных ИИ любого типа

Другие новости

Ближайшие события