Pull to refresh
322
51.2
Владимир @Firemoon

Пользователь

Send message

В статье упомянуто, что многогигабайтная модель грузится в видеокарту ощутимое время, хоть конкретных цифр и нет. 

Но ведь... "Пару минут" (для float32) и "20 секунд" (для float16)...

Человеческий мозг -- это тоже нейронная сеть. Так что 100% моих текстов написаны с использованием нейронных сетей.

Ну, если есть RTX4090 под кроватью, то может быть и выгоднее х)

Можно снизить затраты путем смены GPU, например, на А5000. Там 24 ГБ VRAM, кажется, под эти задачи подойдет, а цена в два раза меньше.

Ну и если нет серьезных требований к аптайму, то поминутная (посекундная!) тарификация в облаке -- это отличный выбор. Отличный выбор, который можно приправить «прерывайкой» (прервываемыми инстансами), что ещё снизит затраты.

Сделать образ, который при первом запросе стремительно разворачивать, а при отсутствии запросов в течение, например, получаса, также стремительно гасить.

Все верно, абсолютно бесплатных вариантов нет.

Но можно получить 18$ на тесты у OpenAI и ещё 300$ у Google, которые можно потратить на Text-to-Speech

На домашнем компьютере примерно 10 секунд, на сервере — 2-3.

Его нет.

Если нет аннотаций, то нужно использовать запросы без [filewords]

Мечты — это внутренний «продукт». Поэтому я считаю, что вопрос этичности лежит на мечтателе, до тех пор, пока мечты остаются только в голове человека.

Мечтами, конечно, можно сделать контент в виде разговора или действительно написать картину. Но разговоры —  это лишь воздействие на собеседника подумать о чем-то конкретном. Это не вызовет ту же картинку и те же желания х)

Написание картины —  это нелегкий процесс, требующий (а) умения (б) желания и (в) мотивации. Да и будет грустно, если «модель» (успешно) попытается уничтожить картину.

Современные технологии в этом плане обесценивают старания. Взял чекпоинты для SD, которые натренированы рисовать прекрасных дам без одежды и понеслась.

Гурманы могут взять ещё какую-нибудь модификацию на конкретного человека или что там им нравится. Я пока готовил эту статью, я находил Textual Inversion, которые рисует женщин-бодибилдеров и чекпоинты (не помню, LoRA, кажется) на какую-то известную женщину. Ух, сколько всего можно придумать! На ровном месте сгенерировать сотни правдоподобных изображений, а интернет помнит всё.

Пожалуй, дополню свой предыдущий комментарий замечанием, что делать контент, а затем распространять без согласия —  вот это плохо. Пока контент не трогает других людей (и даже так не нарушает законы) —  ну штош, пусть будет.

Эмбеддинг (Textual Inversion) активируется только при явном указании в запросе имени файла.

Эмбеддинг (Hypernetwork) может быть активирован через вкладку Settings -> Stable Diffusion. Тогда эмбеддинг будет отзываться на перечисленные слова. А звездочка позволит активироваться при любом запросе.

Если не делать аннотаций, то подставляется имя файла.

Имя файла до обработки: 1.png

Имя файла после обработки: 00000-0-1.png

Подстановка в [filewords]: 1

Я такое не пробовал.

Но в документации AUTOMATIC1111 есть очень скупо про Alpha Mask, возможно, это применимо в вашем случае

Это достаточно дискуссионный вопрос. Но, как мне кажется, основное — законы. Если просто запретить все, что подходит под 18+, то компании просто будет проще. Я сейчас про компании типа Midjourney.

Ну и вопрос этичности никто не отменял. Обучить ИИ на фотографиях конкретного человека и клепать всякий интересный контент с этим человеком без его согласия -- это плохо

Спасибо за дополнение!

Я хотел дополнить текст стилями, что упоминание известных творцов влияет на стиль генерации, но и так статья вышла очень большая.

Мои поздравления!

Хотя все же стоило прислушаться к упрямству MJ: на черном фоне мне субъективно нравится больше.

Ну, эти семь красных линий, возможно, похожи на то, что хотел заказчик. А может и нет ¯\_(ツ)_/¯

Возможность дообучения и переобучения — это неоспоримый плюс SD. Правда, этот самый слон посреди комнаты...

Я слышал про SD в ключе именно отсутствия цензуры, но после вашего замечания (а так же замечаний комментаторов выше в этой статье и пара дискуссий в комментариях к статьям моих коллег) кажется, что разобрать SD повнимательнее — это хорошая идея.

Всё так. Вкладка игры и другой день.

Каждый день одно слово.

Я хотел использовать GloVe, но word2vec подкупил своими тегами...

Отдельной забавы стоит загадать слово, словоформы которого имеют другое значение.

Коллега загадала слово «базили́к» (трава-приправа такая). И по мнению word2vec это слово максимально близко к слову «бази́лика» (эт такой царский дом), что логично, родительный падеж для первого слова пишется так же.

Таким образом в топ-500 слов можно встретить как перечисление приправ, так и перечисление строений. Не повезло тем, кто выбрался в «зеленую» зону на строениях!

Information

Rating
131-st
Location
Челябинск, Челябинская обл., Россия
Works in
Date of birth
Registered
Activity

Specialization

Backend Developer
Middle
Python
Flask
SQLalchemy
Bash
C