«Нет, я не Байрон, я модель». Превращаем прозу в поэзию с нейросетью — мой кейс

Привет всем! Меня зовут Марина, я учусь на втором курсе магистратуры ВШЭ и МТС «Исследования и предпринимательство в искусственном интеллекте». Сегодня хочу рассказать о своем проекте, который начинался как прошлогодняя курсовая. Мне хотелось глубже разобраться в практическом применении больших языковых моделей и методов NLP, а поэзия показалась небанальным способом это сделать.
Казалось, все будет просто, но… нет. Да, тема генерации поэзии хорошо исследована. Большие модели умеют подбирать рифмы, соблюдать размер и даже копировать стиль известных авторов. Но если добавить несколько ограничений — не писать «с нуля», а превратить заданный абзац прозы в стихотворение с конкретным метром и рифмовой схемой, — задача становится намного сложнее.
Для русского языка таких работ почти нет: датасетов мало, а морфология и система ударений создают дополнительные трудности. Поэтому я решила проверить, получится ли у модели превратить прозу в настоящие рифмованные четверостишия.
Постепенно мой проект вырос в полноценное исследование. Я подготовила по нему статью, и она принята на конференцию «Нейроинформатика-2025». Если будет интересно — ссылку прикреплю после конференции, а пока хочу рассказать о своем проекте без формализма.