Исследователи Московского технического университета связи и информатики (МТУСИ) заявили о разработке алгоритма составления запросов к генеративным нейросетям (промптов), позволяющего получить наиболее качественные изображения. Разработка и тестирование системы проходили с использованием ориентированных на русскоязычную аудиторию сервисов «Шедеврум» и Kandinsky, указывает ТАСС со ссылкой на пресс-службу МТУСИ.
По словам исследователей, существующие сейчас инструкции по составлению запросов ограничиваются рекомендациями, что лучше указывать и от чего отказаться. В свою очередь, их разработка — это пошаговое описание, с чего надо начинать составление запроса, как сформулировать в промпте ожидаемые детали будущего изображения. В алгоритме содержатся моменты составления запроса и несколько альтернативных путей их составления.
«При разработке алгоритма составления промптов, позволяющих получить качественное изображение нейросетевыми онлайн‑сервисами, определены факторы, приводящие к некорректным результатам генерации изображений посредством естественно‑языковых, неформализованных запросов. Создана методика описания объекта, явления или процесса, для апробации разработанного алгоритма и определения его эффективности выбраны нейросетевые онлайн‑сервисы „Шедеврум“ и Kandinsky», — пояснил д.т. н., профессор кафедры МКиИТ МТУСИ Юрий Леохин.
«Результаты проведённых экспериментов показали, что разработанный алгоритм формирования запроса к нейросетевым сервисам для генерации изображения позволяет получать более корректный результат по сравнению с обычным естественно‑языковым запросом. Особенно это заметно на запросах, содержащих отрицательные частицы и предлоги, относительные прилагательные, предполагающие представление абстрактного понятия, и при использовании числительных», — отметил к.т. н., доцент кафедры МКиИТ МТУСИ Тимур Фатхулин.
К сожалению, сам алгоритм в СМИ раскрыт не был. Информационная служба Хабра обратилась с запросом в МТУСИ с просьбой поделиться алгоритмом и/или подробностями разработки. На момент публикации материала ответ ещё не был получен.