Комментарии 6
Спасибо! Новые знания получил. Весьма существенная часть текста представляет для меня тот самый "шум") Сомневаюсь, что хоть сколь нибудь широкая аудитория в состоянии его "очистить". Вам ведь нужна эта хоть сколь нибудь широкая аудитория?
Интересно, что на приведённых примерах ИИ успешно проигнорировал половину деталей промптов (например, светящиеся руны оказались на плаще, а не на посохе, у замка большинство домиков таки каменные, а не деревянные, а кот лежит не то что бы на белой подушке). Личный опыт обращения с ИИ примерно такой же — очень долго приходится вдалбливать, что же требуется.
замечательная статья (поставил плюс).
однако, мои личные эксперименты приводят к интересному выводу: чем менее конкретен запрос, тем интереснее картинки, хотя и не всегда соответствуют контексту.
ну и, конечно, приводить всего по одной картинке, на каждый запрос, для каждого инструмента, по меньшей мере, странно. с первого раза, могут и не угадать.
Как писать промпты: вот вам ушат инфы про юнет, матан, шум, обучение модели, энкодер, картинки с архитектурой модели.
Но главное "чем детальнее промпт - тем точнее результат" — что вообще ни разу не правда. И для с сд (1.5, сдхл), чем длиннее промпт, тем сложнее сходимость, и для миджорни, которому в целом по-барабану, что ты там пишешь, и для далле-3, который из всех перечисленных единственный адекватно воспринимает речевой промпт благодаря прослойке в виде языковой модели.
Но ни тебе о важности весов, ни о разнице клип/буру тегов, ни о контроле в виде свапа тегов. Ну и собсно посему на ваших результатах запрос не соответствует результату. Надёргано инфы с других статей, чтоб казаться умным, а выхлопа нет
“Что + где + как”
Я бы лучше посоветовал порядок что + как + где, потому что чем первее токен, тем более он выражен, а токены в конце применяются последними, поэтому первым идёт что (будет занимать большую часть кадра), затем как (добавляет менее крупные детали главного объекта, по сути являясь частью "что") и только затем где (применяется последним для наложения правильного света, цвета, фильтра и тд, добавляя и сам фон). Да и со стороны удобства такой порядок лучше, потому что описание по важности идёт сверху вниз (в начале самое главное, в конце неважные детали)
Спасибо за статью. Кроме шуток, очень актуальный заголовок и отличный тизер " часть 1". Да, возможно, это компиляция других статей и первая часть немного перегружена техническими деталями, но надо оценивать весь цикл. Может автор грамотно использует эту техническую базу при пояснениях в дальнейшем. Для меня загадка почему, итоговые рисунки игнорируют промпт. "Деревья светятся" превращается в светящийся туман вокруг черных деревьев. На моем опыте, казалось бы, точный промпт "стрелочки сверху вниз" превращается в рисунок со стрелочками снизу вверх. Очень жду продолжения.
Как писать промпты для генерации изображений: часть 1