Комментарии 10
а их разве не так делали
Попробуйте с текстом использовать обходной путь.
Мне qwen, deepseek отлично в текстовом формате генерируют схемы, пример запроса "нарисуй схему кластера k8s в формате graphviz", отрисовка составленного текста в схему уже вопрос внешнего сервиса. Удавалось получить и простые иконки в формате SVG.
Если навскидку - формат субтитров ass обладает богатыми возможностями оформления, правда используется для видео, но если поискать - наверняка есть аналогичные форматы, как минимум для мержа картинки и текста, в этом случае нейросетка рисует пустые облачка для текста и даёт габариты для текста в машиночитаемом формате, дальше только состыковать с уже составленным текстом
Чтобы такое хорошо генерировать надо заранее обучить lora на персонажей, на стиль, или взять готовые. С лорой они будут 1 в 1, а не как повезет. Еще можно поискать то что специально было обучено на генерацию манги. Правда SD слишком тупые, так что кружочки с текстом придется рисовать самому или редактировать через другую нейронку.
ИМХО пузыри и текст можно и вручную добавить - быстрее будет. А на ИИ возложить чисто художественное рисование.
Маленькое замечание, манга справа налево читается)
Создание манги с помощью ИИ: генерация идеи, сюжета и визуала