Комментарии 166
хочу поздравить команду, пользуюсь 2.1 регулярно - незаменимый инструмент инди разработчика, арт вдохновения и осмысления
Спасибо! Мы рады)
Спасибо за апдейт! Но я столкнулся с проблемой сразу же)в ТГ боте при попытке генерировать с функцией перенос стиля - результат не выдает и просто висит. нажимаю finish а мне выдает Сначала дождись, пока модель завершит работу. что делать?как его перезагрузить??
ребята, чините 2.2 или откатывайте на 2.1, теперь это бесполезный инструмент, ни один старый запрос не работает, рисунки вообще не в тему.
Странно. Москвич-412 нарисовать не может.

Версия 2.1 выдавала следующий результат:

Это стиль "40К"

так же все мои старые запросы рисуют совсем другие картинки и стили, что-то поломали вы внутри
Видно прямо сейчас подкручивают у меня изначально тоже цветок был, а вот после обеда стало авто =)
Гос.номер автомобиля шикарен.
Запрос "Москвич-412" проходит, а "москвич-412" нет. Это баг или фича?
У меня оба вариант работают, тестировал на сайте rudalle.ru
Вы пишете запрос без должного уважения
Ну так обточи напильником
Это значит - неразмеченный контент. Эта модель даже забор ПО-2 нарисовать не может, хотя его в стране больше километров, чем ж/д путей наверное
Ну, всё как в старом анеке про мужика который с завода колясок детали выносил - "как ни собирай - всё одно пулемет получается"...

Примерно час назад москвич категорически отказывался рисовать. Сейчас рисует. Починили?
Версия 2.2 стала какой-то пресной. Если в версии 2.1 картинки были что надо, то теперь там душа пропала, что ли.




и так далее
Это уже из статьи видно, не "смешной милый котик дарит цветок", а кот с цветком по факту.
Судя по всему, Сбер проморгал рождение "сильного ИИ" в Кадинский 2.1, выключили его и запустили Кадинский 2.2, теперь это просто обычная нейронная сеть "без души" :)
Полностью подтверждаю, что ни один из прошлых промптов у меня не заработал. Прошлая версия Kadinsky выдавала креативные идеи даже по одному введенному слову, а новая версия выдает то пластмассу какую-то, то пересвеченную зеленой картинку, вообще не относящиеся к введенному промпту. Будто разработчики решили, что хватит хорошей моделью попользовались, пора переходить на первую преальфа версию. Это не шаг к фотореализму, это 20 шагов назад!
Примеры прошлой версии Kadinsky.























===================================

===================================
А так выглядит на новой модели этот промпт

Интересно что такого в сосновом лесу ("сосновый лес", "pine forest") неприличного что Кандинский отказывается генерировать "Запрос не соответствует правилам работы с инструментом.". А так сеть классная, даже просто поиграться затягивает.
что такого в сосновом лесу ("сосновый лес", "pine forest") неприличного
Арнольд Шварценеггер читает Пастернака? )
Видимо бдительная цензура нейросети считает что "сосновый" - это от слова "соснуть".
старые-добрые "застрахуй команду корабля", и прочие фильтры снова в деле
А то и похуже. Мне ChatGPT 3.5 на запрос "что сосала Саша, когда шла по шоссе?" сказал, что он не может выдавать ответ, содержащий неприемлемые и нецензурные выражения. Чего-то мы, видимо, о Саше не знаем.
Hidden text

Если конкретизировать вопрос («речь про известную русскую скороговорку на шипящие») или задать роль для ChatGPT («прими роль эксперта по русским пословицам, поговоркам и скороговоркам»), то ответ будет… всё равно неточным, но порнографию оно там уже не увидит и про сушки всё же скажет…
Проверил в 3.5 и 4.
А бор, видимо, представил как химический элемент. Получилось что-то совсем непотребное и опасное)
Urban Dictionary утверждает, что словосочетание "pine tree" — "Another name for a penis". Мир полон удивительных открытий (=
Не - как хотите, а я пока откровенно недоволен. Только недавно я смог добиться от тов. Кандинского сносного результата по довольно затейливому промпту (по смыслу полный пролет конечно, но выглядит целостно и доработать можно), как после апгрейда, он мне выдал совсем негодный варик, похожий на работу школьника или художника-концептуалиста.
Увеличились ли требования к врам? Если да, то насколько, при одинаковых входящих и размере генерации
На старые слова из стоплиста также цветочит, но поменяв чуть-чуть запрос получаем добро.
Запрос: «подводная лодка в степях запорожья»
Выхлоп:

На запрос «алиса селезнёва, озорная девочка, гостья из будущего» получил отлуп «The request does not comply with the terms of use.»
Что не так в этом запросе?
P.S. Генерировалось на editor.fusionbrain.ai
Алиса Селезнёва с миелофоном в Космозо в полный рост


Надпись слева вверху похожа на Росатом :)
Судя по всему, создатели современного римейка «Гостьи из будущего» явно использовали старую версию Кандинского
/Сарказм выкл
Теперь в стоп-лист попало слово «убивает»
И теперь вместо «олгой-хорхой в распадке между сопок весной в песчаных частях западной Гоби убивает приближающихся к нему людей» приходится использовать «олгой-хорхой в распадке между сопок весной в песчаных частях западной Гоби отравляет ядом приближающихся к нему людей»
Но выхлоп по этому промту разочаровывает…

Промпт: «охотник с ружьем преследует раненную кабаргу пробираясь за ней через плотную чепуру в конце лета»

два

три (терминатор на тропе охоты)

Промпт: «полная молодая женщина в расстегнутом кафтане играет в игральные кости»

Да и кафтан совсем не виден…
Следующий промпт (к которому Кандинский явно не равнодушен): «ксеноморф собирает ромашки на поляне в лесу»

Теперь перейдем к Алисе Селезнёвой
Промпт: «Алиса Селезнёва с миелофоном в руках»

Промпт: «красивая девочка 11 лет Алиса Селезнёва с миелофоном в руках»
Вот тут уже лучше, но нейросетка схитрила, и она не стала рисовать руки и миелофон

А теперь попробуем тот запрос, по которому сеть в прошлый раз стала генерить бухенвальдских крепышей: «Алиса Селезнёва, девочка высокого роста со светлыми короткими волосами и спортивного телосложения, одетая в комбинезон»



Но ведь это уже не девочки, а девушки?!
У меня складывается устойчивое мнение, что запрос на русском сначала переводится на английский, а уж потом скармливается Кандинскому.
Уточним наши хотелки в такой запрос: «Алиса Селезнёва, девочка одиннадцати лет, высокого роста со светлыми короткими волосами, спортивного телосложения, одетая в комбинезон»





Уже гораздо лучше ;)
Я верил что это случится рано или поздно и это случилось, появились проекты для запуска Kandinsky c UI на локальной машине:
https://github.com/MMqd/kandinsky-for-automatic1111 — плагин для широко известного webui
https://github.com/seruva19/kubin — отдельный проект webui по мотивам плагина
https://github.com/deforum-art/kandinsky2-simplegui — простой gui если верить описанию
По обзорам всё отлично...
https://rudalle.ru/check_kandinsky22/a8653909-7b31-4805-ba28-2b02455dcd9f#
Да, как то стало пресно...

Объясните кто-нибудь, что такое "Отправьте картинку именно как картинку, а не как файл". На десктопной версии такой разницы нет, но и присланных картинок бот не замечает и их не обрабатывает.
чет как-то не...

зато запрос "квас с хреном" не проходит, уточнения типа "зеленое растение хрен в стеклянной банке с солью" тоже не соответствует правилам
двадцатиколёсный грузовик

В детальные описания как не умело,
так и не умеет

Мне зашло. Предыдущая модель совсем не понравилась, а здесь уже достойное качество!

Компьютерный инженер в защитных очках разрабатывает алгоритм машинного обучения на экране монитора, ссылаясь на графики и диаграммы, символизирующие автоматизацию и интеллект. Фон представляет собой инновационные технологии и цифровые сети.
Космодесантника мне кто-нибудь нарисует уже? Очень нада!
Компьютерный инженер в защитных очках
За такие защитные очки Вам любой ОБЖшник что-нибудь открутит.
Так мы не знаем, от чего они защищают
Может, они покрыты соком кактуса и защищают, соответственно, от лучей смерти
Вот космодесантник.Старая версия Kandinsky 2.1 были и покруче картинки, но я удалил уже.




=================================
Эти на новой версии Kandinsky 2.2. Промты все разные, кое как удалось убрать пластмассовость.





n
остальные здесь https://postimg.cc/gallery/svML7ks
Я просил совершенно конкретного космодесантника.
Версия в Upscale 2X

Это уже, по крайней мере, в Красную Армию. Но ни одна из виденных мною сетей такого не рисовала. Откуда это?
Это Kandinsky 2.2 с использованием стерки и промптов каждый раз, когда стераем что-то. После создания изображения я загрузил его в Dezgo, выбрал Image-to-Image и создал на основе этого несколько вариаций. Там он выдает очень много вариаций, почти бесконечно. Вот несколько из них.
https://postimg.cc/gallery/gk3PtCV/fb821880
Но дело в том, что в Kandinsky 2.1 работа стёркой была быстрее.


Вы же понимаете что для того чтобы нарисовпть чтото из фильма, кадры этого фильма должны попасть в обучающую выборку?
Однако почему-то когда я прошу мясного художника нарисовать мне сиреневого шестикрылого семинога с клювом вместо носа и торчащим из горба рогом, у него это получается, хотя он никогда таких зверей не видел.
Так он и его неправильно рисует, вы не замечаете, потому что тоже не видели. )
его неправильно рисует, вы не замечаете
Ну, я сиреневый от зелёного отличить пока ещё могу, как и шесть крыльев от четырёх.
Добавьте в запрос "из фильма ...", и станет понятно, что рисует он неправильно. )
А можете тогда объяснить, что не так со сгенерёнными картинками? На обеих дракон, на первой видна попытка обыграть его имя птичьим профилем, а на второй добавленное уточнение "дракон удачи" видимо понято как статуэтка дракона, приносящая удачу.
Я фильма не видел и честно не понимаю, что топикстартеру не понравилось.
А можете тогда объяснить, что не так со сгенерёнными картинками? На обеих дракон
Я фильма не видел
В том-то и проблема

В том-то и проблема
Согласен. Это вы предыдущие два поста пытались через некорректную аналогию доказать, что не проблема.
Корректной аналогией было бы сказать, что мясной художник, прежде чем рисовать, посмотрел бы фильм (или хотя бы скриншоты полистал).
И вот то, что нейросеть (пока что) не может самостоятельно принять решение, найти новые данные и дообучиться, это правда.
Ну гугл же знает.
Вот странно, что известных персонажей мультфильмов и сказок нейросеть не знает. Попросил нарисовать Шапокляк - нарисовала какого-то агента в шляпе. Причём, в очках с по-разному разбитыми стеклами (не знаю, как это правильно описать). Вместо Чебурашки неведомого зверька рисует. Причём, ведь именно зверька, т.е. о чем-то явно знает, но никаких больших ушей нет.

Может есть какая-то возможность дообучить сетку на каком-то русском дата-сете, чтоб она понимала запросы и пр из русской культуры?
Нужно писать запрос на английском, в данном случае это "three bogatyrs"
Выхлоп
Какие-то эти богатыри монголоидные...
Ну так оне изначально такими были, пока не обрусели ;))
«Мильоны — вас. Нас — тьмы, и тьмы, и тьмы.
Попробуйте, сразитесь с нами!
Да, скифы — мы! Да, азиаты — мы,
С раскосыми и жадными очами!»
И всё честь по чести, слева Алёша Попович, по центру Илья Муромец, справа же Добрыня Никитич!

Наверняка четвертый богатырь, это Ленин, поскольку он в «Разливе»
По запросу "женский сундук" нарисовало макет торса с надетым бронелифчиком.
А вот по запросу "женские олуши" (олуши = boobies) мне удалось обмануть цензуру нейросети.
Стиль не устанавливал (no_style).
женские олуши
Ааааа, так вот кто автор анекдота с участием страуса и мокрой кошки!
"Красивая девушка показывает свои дыньки/пирожок/etc" тоже даёт иногда интересные результаты;)
Женские синички?
Да, "женские синицы" тоже работает. Видимо это говорит о том, что под капотом нейросеть англоязычная.
Интересно, а как на перси прореагирует?
Про перси нейросеть думает что-то про персию.
Похоже можно писать английские слова и транскрипцией. Например "титс" или "пусси". Причём "пусси женщины" бывают то коты, но может получиться и портрет с голой грудью. Можно написать "женщина без одежды", тоже будет портрет с голой грудью. Ниже груди не смог заставить сделать, видимо не было такого в обучении.
Думаю обучали на наборах изображений с английскими описаниями, а русский запрос переводят на английский перед скармливанием нейросети.
Прошу прощения за оффтоп.
Ваши достижения безусловно заслуживают уважения и восхищения, поэтому, пользуясь случаем, прошу вас передать небольшое пожелание команде разработчиков ПО для банкоматов. Пусть они проведут файнтюнинг ПО и имплементируют нормальный ввод ФИО.
Поясню. Сейчас при вводе ФИО только первое слово начинается с заглавной буквы. При вводе пробела регистр не меняется. При смене регистра он залипает, т.е. после ввода первой буквы приходится снова менять регистр. Ребята, это однофункциональное поле ввода для ФИО.
P.S. Извините, забыл как делать спойлер.
Эта нейросеть напрочь не знает ничего русского. На попытки сгенерировать персонажей русских сказок или мультфильмов выдает что-то неведомое. Попробуйте сгенерировать Бабу Ягу, Дядьку Черномора или Чебурашку. Незнайка и Пончик на Луне - выдает какого-то мультяшного астронавта верхом на пончике, который выглядит, как донат, а не пышка. Про Москвич выше написали уже. БелАЗ нормально визуализировать тоже не может - выдает какой-то неведомый бульдозер.
Если попытаться ввести какой-то фразеологизм или пословицу - тоже все мимо. Хотя я пробовал вводить самые простые. Если их ввести в любой поисковик, первым же результатом будет истинный смысл, его легко визуализировать.
В общем, эта штука генерирует красивые, но нежизненные картинки. Такое ощущение, что совершенствуют алгоритмы в направлении "как бы выдать поярче, погламурнее, покрасивее и поэффектнее", а над смыслом не думают вообще. Про русское я уже написал - как будто база знаний у нейросети напрочь американская, а про наше она ничего не знает. Семейку Аддамс рисует на раз, а вместо Гагарина или Высоцкого выдает какого-то непонятного персонажа. Это тоже отдельная тема - зачем напрочь искажать лица известных людей? Особенно, когда выбран стиль "фото"? Я именно реалистичности хочу, а мне какую-то мультяшность выдают. Иногда к людям лишние руки или ноги приделывая, или пальцы на руках.
напрочь искажать лица известных людей
Может это для борьбы с фейками? :)
Попробуйте сгенерировать Бабу Ягу
Попробовал :)

Результат неожиданный...
Вот и до бабы повесточка добралась...
Ну это ещё ничего. Мне выдавало гламурную молодую девицу в старой одежде. Но и то - её хоть сейчас на модный показ можно.
Под капотом сетка англоязычная, так что, возможно, "Баба Яга" сначала превращается в "Bogeyman" и только потом запускается синтез картинки.
как будто база знаний у нейросети напрочь американскаяВы начинаете что-то подозревать. «Как будто», хаха.
Ну и при чем здесь Сбер?
У Вас есть не подозрения, а знания? Расскажите, почему она нерусская, если знаете.
Ну, вот у меня получилось изобразить космонавта Терешкову. Нейросеть взяла нынешнюю Терешкову и нарисовала её в скафандре с открытым шлемом.
Похоже, что это редкое исключение!
зачем напрочь искажать лица известных людей
Для того, чтобы выполнить требования закона о персональных данных. Изображение лица является персональными данными человека.
Супер, но не получаются спящие люди.
В чем конкретно не получаются?
вот примеры вполне неплохие
https://rudalle.ru/check_kandinsky22/fb28246e-ff5d-45df-83d9-7d03d20e689d
https://rudalle.ru/check_kandinsky22/f26524fc-8b10-4ca9-8a03-cf45288e404b
Вторая отлично. А у меня было всегда как на первой, какие-то артефакты на губе. То диван кровать кончается, то нога из руки, то под одеялом ничего нет, постоянно "сломанное" тело.
Не то что, мне очень надо, просто остальное всё получается круто! И лица, как на втором примере, всегда выходят отлично и красиво.
Я не так давно стал интересоваться темой генерации картинок нейросетями, но как мне показалось из опыта, везде проблемы с лицами и конечностями распространены и не имеют стабильного решения. Перебор вариантов, уточняющие и негативные промты позволяет улучшить проблему, но только пока запрашиваемые изображения лежат в "приемлемых" для обучающих наборах рамках. Например, у меня так и не получилось заставить девушку показать заданное (да и вообще любое) количество пальцев на руке выглядещее прилично, хотя казалось бы, что тут необычного.
Используйте редакторы поз:
https://dtf.ru/howto/1870409-obzor-i-sravnenie-5-redaktorov-poz-dlya-controlnet
Да, про тему слышал, но пока руками не щупал. Для хобби в эти огрехи не так критичны, а для проф использования можно и фотошопами дорисовать. Больше интересна причина сложностей борьбы с такими проблемами Это фундаментальная особенность диффузной модели которая не может без дополнительных "ручных" подсказок или просто временные проблемы, причины и пути решения которых понятны и работа ведется?
Эта проблема решена, но надо будет ставить на комп Stable Difusion и посматривая ролики вникать в тонкости настроек https://youtube.com/xpuct
Тогда, может, искать мёртвых людей?
Поздравляю команду с хорошо проделанной работой! Результат роскошен. Но как понимаю все это только начало. Желаю успехов в предстоящей работе!
ps. Стоит ли ждать API в ближайшем времени?
Никакой фантазии





Друзья, я здесь можно сказать зарегистрировался только для того, чтобы высказаться по поводу версии 2.2. Вы что-то накрутили с цветами, почему-то везде прёт желтый с синим, ну прямо кислотно-вырвиглазные цвета, особенно на режиме Cartoon, если пользоваться сайтом для генерации.
Все промпты, которые использовались ранее - не подходят.
Вы сделали упор на фотореализм, но потеряли что-то своеобразное, что отличало kandinsky от остальных моделей.

Посмотрите версию 2.1, какая глубина исполнения, это же просто Доктор Морро ставит один из экспериментов! Нейросеть действительно постаралась сделать "capture the sense of precision and curiosity". Ну да, лапы бывает лезут не из тех мест, откуда предназначены, но суть схвачена очень хорошо.
А что версия 2.2? Поместили кота в кабинет с пробирками. Ну реалистично. Просто уголок дедушки Дурова:

В общем упустили вы некоторую поэтичность что-ли, задушили модель.
Сделайте версию 2.3 с фотореалистичностью 2.2 и поэтичностью 2.1!
Что-то потеряно с выходом новой версии. Она стала какой то "правильной", не осталось той непредсказуемости, какой то "изюминки". Потерялся свой стиль, который её отличал от других моделей. Одни говорят что она стала "пресной", другие что потеряла "душу", я бы ещё добавил что потеряла фантазию. Было интересно "играть" с ней, когда писал разную "абракадабру" на входе и на выходе получал разный интересный результат.
Я даже стал составлять словарь терминов и кодов, когда по одному запросу генерирует изображения в одном стиле:
Уф - пёс
Уд - азиатский старик в азиатском городе
Оно - девушка в одежде на фоне деревенских деревянных домов.
Эт - инопланетянин-насекомое в капюшоне
QWERTY - старая печатная машинка
321УВ - новые ретро автомобили в солнечном городе
321Ю Ю - аморфные старые автомобили
Может не стоит гнаться за реализмом и догонять другие модели, а найти свой стиль?

Hidden text

Уточнение: Указанные в комментарии промпты работали на сайте https://editor.fusionbrain.ai под версией 2.1.
Подскажите, пожалуйста, как пользоваться ControlNet?
Ребята разработчики, спасибо вам за прекрасную сеть, реально кайфую! Но возник вопрос: почему не получается воспроизвести стиль «хохлома» в боте. Совершенно не поднимет запроса (хотя на fusionbrain все ок). Какой Промт писать, чтобы понял?:)
К сожалению, совсем не зашло обновление. У версии 2.1. хоть и были серьёзные проблемы с изображением рук и количества, колёс, например, но картинки получались интереснее и точнее попадали по стилю. Теперь прошу нарисовать изображение в стиле Марка Шагала или хотя бы в стиле Кандинского, а он мне выдаёт реализм. Тоска и печаль, продолжу играться с версией 2.1.
len_elir, а как вы продолжите использовать 2.1?
Есть способ?
Конечно. Например, здесь: https://rudalle.ru/kandinsky2
"Фея в кедах" и в этой версии никак не хочет генериться...
А если попробовать "фея, обутая в кеды" ?
Результат запроса "фея, обутая в кеды" в телеграм-боте:

Результат на сайте rudalle.ru:

Повторюсь, в Telegram-боте даже близко не удаётся получить запрашиваемое. Пробовал с десяток разных вариантов запросов.
Удивительно, что результат так зависит от фронт-енда.
Ну не знаю ... который раз на которой модели прошу простой запрос:
"Мультяшная винная бутылка , в солнцезащитных очках , с наушниками,улыбается"
В десятках вариаций пробовал менять промпт , на разных моделях- бутылку в наушниках и очках рисовать не хочет... в 2.2 все точно так же. Рисует тётку в наушниках, какую-то кракозябру и тп ,но на бутылку наушники не надевает.
То же самое с грибами и белым мхом, мох никогда не белый ,а гриб всегда поганка,какой бы тип не попросил)) но на гриб одевает очки)))
Это даунгрейд по сравнению с 2.1. Все стало пересвеченное, кислотное и перенасыщенное. Как можно было такое выпустить?
К сожалению, у данной модели довольно ограниченная эрудиция. Я регулярно натыкаюсь на предметы, которых эта нейронка очевидно не знает. Например, по запросу "лошадиная подкова" оно генерирует дырку от унитаза, а заставить её сгенерировать стилизованное изображение подковы мне так и не удалось.
Курение ему до сих пор не даётся


И прочие издевательства





Фотореалистичность это, конечно, хорошо, но в других аспектах стало заметно хуже: слишком агрессивно настроенная цензура, которая даёт много ложных срабатываний (например, не даёт генерировать смерть с косой); сами изображения, так сказать, лишились души, стали какими-то пластмассовыми с излишне яркими кислотными цветами. Надеюсь, в 2.3 всё это исправят.
Как же у меня бомбит, в общем. 2.2 версия теперь просто лютый шлак... Стало гораздо хуже. Волосы и бороды теперь, чаще всего, выглядят как пластиковые парики Кобзона. Полный игнор цвета кожи. В общем, сетка ушла куда-то не туда. Теперь даже для выполнения скромных запросов не годится. Да и в принципе, теперь многие результаты выглядят как пластиковые куклы, или 3D-модели 15-летней давности. Столько всего не успел на 2.1 нагенерировать... Зачем было ломать то, что работает? Абыдна.
P. S.
Впрочем, доступ к 2.1 остался. но не через телеграм-бот, конечно.
Как-то много "пластика" стало :( Запрос: "Cute chibi Vampiric lion, white with red accent colors, white fur and red mane, Warhammer 40k, photorealistic, realism, Pixar"


Испоганили нейросеть своим обновлением.
Вот такое письмо, я написал в службу тех.поддержки:
Добрый день, уважаемые разработчики нейросети Кандинский.
Я с первого дня, работал с нейросетью Кандинский 2.1
Было очень много шероховатостей при работе с программой Кандинский 2.1, при создании запросов [промптов] к программе, но в целом, нейросеть планомерно продвигалась к той высоте, на которой находится Миджорни.
Я начал создавать каталог стилей работ известных иллюстраторов и художников, от стилей которых можно отталкиваться при создании своих работ.
Те кто занимались разработкой нейросети Кандинский 2.1, в большинстве своем, сделали верные алгоритмы, которые более-менее точно позволяли нейросети передать стили известных иллюстраторов и художников.
Но что у вас ПРОИЗОШЛО в Кандинский 2.2 ????????
Все посыпалось, теперь многие стили известных иллюстраторов непохожи на них, это какая-то ахинея.
Вы разрушили свой продукт, зачем ?
Я прикрепляю к письму, для примера, две картинки в стиле Бернара Бюффе, одна из них подготовлена в нейросетью Кандинский 2.1, а другая в нейросетью Кандинский 2.2.
Сравните их и вы увидите что после обновления, нейросеть выдает ахинею.
Т.е получается у вас, что при последующем обновлении, выдается нестабильный результат.
А раз это так, то какой смысл вкладывать свое время, свои усилия, художникам, оформителям и дизайнерам, если при последующем обновлении нейросети не гарантируется похожесть стиля ?
Лучше тогда забыть о вас, как о страшном сне.
Я тоже набрал кучу стилей художников, которые хорошо работали в нейросети Кандинский версии 2.1, но теперь все уперлось в реализм, и стили игнорируются.
Надежда одна - что разработчики сделают выбор прежней модели на сайте https://editor.fusionbrain.ai/
Слежу за нейронками от сбера со времен malevich, и к 2.2 отношение довольно неоднозначное: Во первых, разные размеры изображений это топ! (плюс куча сфер применения), В плане генерации сеть немного лучше понимает редко употребляемые слова (стал понимать "суслик", "боке") Но все еще не понимет "лобзик", "шишка". Главная претензия: Чините систему цензуры! На безобидные запросы отказывается генерировать, уже каждый второй запрос отклоняет, отбивает всякое желане даже заходить в бота. Я согласен, цензура должна быть, но сейчас она слишком душная. Например: "молодая девушка в белом национальном костюме с красным узором". Отказано. Что именно не понравилось, не известно. Более того, она не предсказуемая. Провел эксперимент, запросил несколько вчерашних промптов. Что отказывало, теперь генерирует, что генерировало иногда отказывает. Это немного странно. Еще и ждать приходится по пол минуты, пока тебе откажут, нет бы сразу написать. Жду доработок, пока заграничные сетки выигрывают.
Граждане, товарищи, господа из сбера, объясните вашей сетке, что есть вислоухие кошки. Вислоухие! В поиске в браузере забейте и скормите сетке. Ну пожалуйста...)
продались с потрохами

Криповатенько;)
Сервис шикарный, спасибо!
Единственное - кто регулярно пользуется, тот знает (надеюсь) что текст для генерации надо вводить на английском языке! Ибо все что вы вводите - все равно сначала переводится в английский и только потом - идет генерация...
Кстати - я к этому выводу пришел очень забавно. просто игрался с сервисом. В какой то момент взял фразу, содержащую название санатория "Ай-Петри"... Тогда я не придал значения - почему в результатах неизменно присутствует большое количество глаз - прямо от ока Саруона, до салата из глаз в блюде Шрека... Ну глаза и глаза...
В следующий раз я столкнулся со странностями на запрос "снежные крошки летят"... не буду говорить что получилось - если интересно, попробуйте сами :) (можете предугадать, если переведете последнее слово на английский и потом обратно на русский в виде существительного). Но этот результат заставил меня задуматься. Немного поэкспериментировав, я убедился что сервис работает именно с английским языком.
Я даже хотел запилить статью на хабр с этими "исследованиями"... Но руки не дошли...
(руки не дошли - хороший запрос на генерацию для руско-английского сервиса)
А недавно разговаривал со знакомым писателем. Он в восторге от сервиса - пытается генерить иллюстрации к своей книге. Я ему посоветовал использовать английский... при следующей встрече он был очень серьезен. Во первых - он подтвердил мою правоту. Во вторых - поделился своими забавными запросами. У него в книге один из героев - собака. Сенбернар. Так вот - до моего откровения с английским он несколько раз пытался сгенерировать картинку с собакой. Так вот - на все запросы с сенбернаром ему приходил отказ в генерации по причине "контента для взрослых"... После моего совета он написал породу собаки по английски и получил отличные картинки. Кстати - спасибо за сервис и от него тоже :)
Kandinsky 2.2 — новый шаг в направлении фотореализма