Pull to refresh

Comments 31

"Зато DALL-E полностью бесплатны" Dall e 2 не бесплатный, после ограниченных попыток надо пополнить кредиты.

Здравствуйте! Спасибо за уточнение. Исправили!

Нейросеть вполне способна заменить фотобанк для рисованых иллюстраций. Но поверх результата нужна работа человека.

Нейросети подкидывают неплохие идеи. Сгенерированные изображения можно использовать как референсы.

я для себя понял, что мне нейронка помогает по тексту сгенерировать быстро вариантов, потом показать дизайнеру (или самому себе) и сказать "вот такое же, но без странных артефактов"

например из Midjourney

увы, пока что глаза и уши - это самое больное у нейронок

но зато ширина рандома вариантов и детализация пикселей - просто невообразимые

Тестировал еще нейронку Stable Diffusion - она уже умеет из коробки "дополнять рисунок" по маске - отличная вещь. Так глядишь и до анимации дойти можно будет

На самом деле сетки генерируют глаза ничуть не хуже всех остальных достаточно сложных деталей: может даже лучше, учитывая гигантское количество лиц в тренировочном датасете.

Проблема лишь в том, что наши биологические нейросети заточены на распознавание глаз (и лиц вообще) эволюционно: и обучаются в этом направлении всю жизнь (e.g. человек лучше различает людей тех рас, в обществе которых он вырос)

Нас трудно обмануть неидеальными искусственными лицами, но легко - искусственным чем угодно другим.

По маске как? Изображение как источник или изображение как цель?

Изображение-источник (набросок с мазками цветов) в изображение-цель (полноценная картина). На Joyreactor была статья, но, думаю, давать такую ссылку на Хабре негуманно :)

Можете ссылку в личку прислать? Спасибо заранее

Кстати, в Midjourney 3 уже интегрировали модель Stable Diffusion) По идее, должен получиться микс из миджорневской артистичности и стэйблдифьюженской точности композиции/деталей. Говорят, Midjourney 3 теперь заметно лучше справляется с лицами и руками. Правда пока доступна только бета, чтоб попробовать надо в конце запроса приписывать --beta или что-то такое (сорь, сам не пробовал пока, руки до Midjourney не дошли)

Отключили на доработку бету пока что, но была шикарна. Лучше чем чистая SD — была аккуратность SD и полное соотсветствие запрашиваемому стилю от MJ (их новый апскейлер вообще идеально в стили может)

Формулировки должны быть буквальными: без метафор, эвфемизмов, словесных каламбуров и прочего.

Ну вот ещё, буду я сейчас перед ИИ пресмыкаться. /с
А вообще он вполне способен грибные фантазии выполнять. Вот пример:

Кind elephant streaming around sweet Kakapo cyberpunk by Salvador Dali
Кind elephant streaming around sweet Kakapo cyberpunk by Salvador Dali

Использованный для генерации текст: "Кind elephant streaming around sweet Kakapo cyberpunk by Salvador Dali". Проверял до какой степени игра слов может вообще быть воплощена в изображение.

А вот на фразе "swarm of sweet puppies introducing themselves to hotdog". Он реально ломается. От swarm желтый цвет в наследство от ос или пчёл. А может быть и от горчицы. Но там щенки морфятся в хот-доги, и становятся не распознаваемы.

Избегайте отрицаний

Вот это как раз может работать особенно с параметром --no. Но есть вещи которые "взаиминеисключаемые", при попытках заставить ИИ создать портрет одновременно: "молодой", "лысой", "без ушей" женщины, придётся очень сильно напрягаться с весовыми коэффициентами. Т.к. лысая женщина для ИИ - старая. Без "ушей", - значит уши чем-то прикрыты, спрятаны (т.е. волосами чаще всего). Очень много мороки.

Но добиться от этого ИИ можно очень многого, принимая те байасы которые у него есть и понимая, как их обходить и двигать генерацию в нужную сторону.

Картинки

Хотя с анатомией человека беды у ИИ из за недостаточно большого кол-ва параметров.

Человек целиком умещается только как образ, а детализация возможна только на определённых "частях" человека. Ноги отдельно, корпус отдельно, Голова отдельно, руки отдельно, предпочтительно со спины, а если лицом к зрителю, то обрезка деталей и трансформация спины во фронт: лопатки в грудь, мышци живота и рёбра из хребта, разворот ступней в последюю очередь, а кисти рук уже не помещаются.

Это не самое страшное с чего можно начать:

Hidden text

Неправильно: «Обезьяны занимаются бизнесом»
Правильно: «Обезьяны сидят в деловых костюмах»

ИИ можно смело пускать в работу, когда при вводе двух строк выше у него на возврат будет тысяча и одна язва по теме ))

При генерации картинок проблема подбора ключевых слов.
Делаю открытый репозиторий ключевых слов на https://www.fartofart.com
Собрал и обновляю картинки Midjourney, вытаскиваю ключевые слова. Предлагайте идеи.
Тема интересна. Результаты автоматом на гитхаб или линк на API.

Но откуда на первом изображении яйцо? Может, есть предположения? Делитесь идеями в комментариях.

Скорее всего из западноевропейской культуры - кролики тесно связаны с пасхальными яйцами

Нейросеть — конкурент? Мнение ведущего дизайнера

Нейронная сеть способна помочь в поиске концепций — подсказать вариант, который может направить мысль дизайнера в нетривиальное русло.
Как раз человеку фантазии не занимать в сравнении с такими системами. Просто их рисовать нужно уметь, и это долго, а тут готовые сразу) Если их у дизайнера нет, то смените дизайнера. Вероятно со временем к этой профессии требования изменятся, нужно будет уметь не рисовать, а придумывать запросы.

Спасибо, интересный материал.

Абсолютно согласен.

Думаю в ближайшие 1-3 года картинки от подобных сетей нельзя будет отличить от профессиональных фотографов, иллюстраторов, графиков и даже высококлассных художников.

Как пример: изображение от Mid Journey на днях заняло первое место в конкурсе художников в штате Колорадо.

Произведение искусства, созданное ИИ, заняло первое место на конкурсе изобразительного искусства на выставке штата. Художники в ярости

С иллюстрациями да, но с реалистическим искусством, напр, в стиле Шишкина и высокохудожественным фото вряд ли пока. Художники воплощают образ, а он не всегда перекодируется в абстрактное представление, т.е. описывается словами. Всегда имеется недосказанность, по определению абстракции передаваемые словами это сжатое представление информации, а потому с потерями. Это к тому, что заказчик не может точно передать возникший у него образ словами такому ИИ, а тот в свою очередь будет производить аппроксимацию заказа в собственном контексте, и дальнейшим искажением смысла предполагаемого в исходном образе. Художники часто переписывают картины, и не раз, когда чувствуют, что им не удается воплотить желаемый образ. На абстрактные темы, да, нагенерил 100 штук вариантов, и выбрал наиболее подходящий. Конечно можно подбирать и наиболее отражающий образ, но это уже сфера этики, эстетики и компромисса. Вероятно, это творчество не плохо ляжет на концептуальное искусство) В нем не требуется выражение образа, а как раз выражение некой идеи, ее воплощения.

У нейронка нет души. Постоянно какой-то треш, ужасы

Я бы хотел обратить внимание на другой момент в статье:

Представьте, что вам нужно выбрать одну дверь из тысячи — за ней будет сундук с золотом. Рядом стоит «помощник», который знает наверняка, где спрятаны богатства. Вы его спрашиваете, какую дверь нужно открыть, чтобы обогатиться. А помощник отвечает: «Точно не 178». Стала ли задача проще от его подсказки?

Здесь, я думаю, стоило бы говорить как будто ведешь бинарный поиск. Стоило вместо точного расположения комнаты спросить: "Вот от той двери, напротив которой я стою, справа или слева находится дверь, за которой лежит сокровище?" вместо точного расположения комнаты.

Иначе говоря, стоит задать вопрос, на который можно было бы дать только один ответ из двух возможных вариантов. "Да-Нет", "Лево-Право" и т. п.

Допустим помощник отвечает: "Слева.".

Тогда:

Я: Ты можешь забыть все те двери, которые были справа и принять те, которые слева, за новый ряд?

Он бы ответил "Да." или "Нет.".

-------------

Я: Точно забыл?

Помощник: Да.

-------------

И далее, я бы встал напротив середины нового ряда дверей и повторил бы весь сценарий, всю цепочку вопросов и указаний до вопроса "Точно забыл?".

Что думаете?

Заменят ли нейросети дизайнеров — пока сказать сложно.

Мне чудится такой апокалиптичный самоподдерживающийся сценарий: нейронки вытеснят джунов (сначала дизайнеров, а в обозримом будущем может и программистов), а потом настанет какой-то эволюционный тупик, т.к. где найти замену постаревшему сениору, если нет толпы джунов, из которых он должен вырасти и отсеяться? Заменяем сениора нейронкой - качество продукта падает, но деваться некуда - сениора то неоткуда взять (и ИИ тоже не у кого научиться). Ну и дальше как с картошкой и Ирландцами. Картошка дорожает? Покупаем больше картошки. Нейронки справляются всё хуже? Вешаем больше задач на нейронку.

Думаю, к тому времени нейронки уже будут делать работу сениора не хуже человека.

Рэй Курцвейл до сих пор уверен, что сингулярность произойдет в 2029.

а можно вопрос о поддержке Selectel ?

Вы вот здесь пишите различные статьи по ML и выступаете экспертами в данной теме, что бы привлекать клиентов на ваши мощности.
А дальше, вы отслеживаете воронку?
Как работает ваш саппорт насколько он компетентен?

Здравствуйте! У нас многоступенчатая структура саппорта. Все сотрудники техподдержки проходят обучения по продуктам компании. Например, когда у нас выходит новая услуга, они получают все необходимые вводные от продакт-менеджера и проводят очные встречи с PM и командой разработчиков.

Также часть сотрудников техподдержки профилируются на более сложных технических кейсах — бывают случаи, когда наши сотрудники находят ошибки в скриптах клиентов, помогают их исправить (хотя это и выходит за круг их ответственности). 

Наконец, разработчики продуктов всегда на связи и готовы помочь клиентам. Как в тикетах, так и в комьюнити Selectel.

Скажите, пожалуйста, почему вы заинтересовались нашей техподдержкой?

>>Скажите, пожалуйста, почему вы заинтересовались нашей техподдержкой?

а как вы думаете? мне просто абстрактно интересна она? или потому что я столкнулся с вопиющей некомпетентностью и нежеланием помочь сотрудников вашей многоуровневой поддержки?

PS многоуровневость поддержки клиентам кажется не важна, в отличии от желания и возможности помочь клиенту отдать вам деньги.

--- кейс ----
в обращении задается конкретный вопрос про инференс конкретной модели, с просьбой помочь подобрать сервер, в ответ получаем отписку со ссылками на конфигурации

цитата
>> "Специальная оптимизация и тестирование нами указанного ПО на серверах не проводилась, поэтому мы не можем рекомендовать какие-то конкретные конфигурации "

вопрос был про попсовую модели от huggingface, а не что с марса

Рекомендовать конкретные конфиг действительно иногда непросто. Напишите, пожалуйста, мне в директ номер тикета (если вы обращались из тикета) или просто уточните, куда конкретно вы обращались за поддержкой. Возможно, вам больше подойдет отдел пресейлов.

Так дизайнера или иллюстратора? Авторам подобных статей стоит уж определиться. Сложные интерфейсы вам тоже нейронка делать будет?

здравствуйте, нужна помощь в связи с исчерпанными лимитом … help ))

Здравствуйте! Напишите свой запрос)

Sign up to leave a comment.