Комментарии 8
Лучшая статья, которую я читал за сегодня
перевод ?
Здорово конечно, но решает проблему лишь формы, а не содержания.
Основная проблема контроля генерации, собственно в самой генерации, на текущий момент нейросети не умеют гененировать 2 картинки человека в разных позах с однинаковым контентом на них.
Мне кажется проблема контроля не будет решена, пока сети не научатся генерировать слоями.
т.е. примитивно примером: слой1 - задний фон (комната), слой 2 - стол, слой 3 - предмет на столе, слой 4 - человек, в этом случае уже можно будет создавать комикс, где на первой картинке девушка в комнате берет со стола бутылку молока, на второй - ее пьет, а на 3й ставит на стол уже пустую. И далее уже в этой локации происходят какие-то другие сцены.
В теории это возможно уже сейчас, но усилий в "подгонке кадров" больше, чем затратит художник на эти кадры.
Как работает ControlNet. Контролируемая генерация изображений