Комментарии / Профиль netsvetaev / Хабр

Product Manager, UI Designer, Entrepreneur

Подписчики

Релиз Invoke AI 2.0 — интерфейса и инструментария для Stable Diffusion (win/linux/mac)

netsvetaev 24 апр 2023 в 03:55

Вы можете перенести контент (models, outputs), но питоновские библиотеки придется установить заново. Просто пропустите загрузку моделей на другом ПК и скопируйте файлы в новые пустые папки. При следующем запуске Инвок должен их увидеть и запуститься.

Аналогичным образом вы можете вынести контент за пределы папки invokeai и указать путь до моделей и генераций в конфиге или при установке.

Я обучил нейросеть на своих рисунках и отдаю модель бесплатно (и научу вас делать это)

netsvetaev 9 фев 2023 в 12:46

задушили 2.0, когда отфильтровали по ошибке слишком много похожего на эротику. В 2.1 контент вернули. Но там используется другая ассоциативная модель и да, запросы нужно формировать иначе. Я и сам испытываю проблемы с этой версией, пока проще 1.5.

Я обучил нейросеть на своих рисунках и отдаю модель бесплатно (и научу вас делать это)

netsvetaev 9 фев 2023 в 12:07

Спасибо за интересные вопросы!
Я не уверен, что этот гайд актуален сам по себе, некоторое время этот вариант не работал. Сейчас есть более интересные решения от runpod.io и, кажется, rundiffusion.
fp — это не совсем формат файла, скорее способ хранения информации и ее кодирования. Чем меньше, тем меньше файл, но хуже качество, но зато работает быстрее. В целом, между fp16 бит и fp32 бита разницы почти нет.

Конвертация в ckpt и обратно — не очень нужна в данный момент (если что, в последней версии InvokeAI есть конвертер туда и обратно). Просто ckpt был неким форматом по умолчанию, пока HF не сделали API diffusers со своим вариантом хранения. В теории (да и на практике уже) это гораздо лучше, чем ckpt.

Разрешение для обучения может быть любым. Например, для SD1.5 стандарт — 512px, но есть модели, обученные на 768x768. Сейчас я рекомендую обучать новые модели с помощью SD2.1 — и разрешение на входе выше, и детализация латентного пространства увеличилась, больше деталей сохраняется. Просто помните, что увеличение размера сделает обучение более медленным и привяжет вас к этому разрешению (делать картинки, отличные от установленного размера, можно, но результат будет менее предсказуемым, особенно, с меньшими размерами).

К сожалению, большей детализвции по умолчанию и совсем без ручной доработки вы вряд ли добьетесь, но, если обучить на изображениях типа 768x1024 и потом обработать генерации еще раз (img2img или hi-res fix), можно получить более точные результаты.

Релиз InvokeAI 2.2: универсальный холст, удобные установщики, автозагрузка моделей и DPM++

netsvetaev 9 янв 2023 в 20:55

скорее всего, у вас не один питон. Это решаемо, переключите его на нужую версию.

Релиз InvokeAI 2.2: универсальный холст, удобные установщики, автозагрузка моделей и DPM++

netsvetaev 18 дек 2022 в 14:21

Версия 2.2.4?

Я уже не помню, в чем беда — у некоторых он пропадает. Напишите в дискорд, пожалуйста https://discord.gg/FC5U4U2Q (и попробуйте там поискать)

Релиз InvokeAI 2.2: универсальный холст, удобные установщики, автозагрузка моделей и DPM++

netsvetaev 14 дек 2022 в 21:00

Если бы написать кроссплатформенные установщики было так легко, то инструкции бы не потребовались. Вы правы, однако, в реальности возникает вопрос: как?

Задача следующая: заставить питон с виртуальным пространством со всеми зависимостями работать на четырех платформах в 5 комбинациях (win+nvidia/lin+nvidia+amd/macm1/mac86+amd/). А софтовых комбинаций и конкретных видеокарт еще больше.

Вы описываете то, что команда постаралась сделать: автоматическую установку через запуск одного файла. Сейчас это работает для большинства людей. Но чем больше пользователей, тем больше удивительных сочетаний железа и софта, которые почему-то не работают. Как все это сделать без багов и без инструкций на случай багов я решительно не понимаю (но я и не программист).

Помочь всем и сразу мы точно не можем, ПО без ошибок не существует. Однако, когда пользователи пишут об ошибках и своих конфигурациях, разработчики заинтересованы в решении их проблем и могут помочь и им, и всем другим с подобной ошибкой.

Релиз InvokeAI 2.2: универсальный холст, удобные установщики, автозагрузка моделей и DPM++

netsvetaev 14 дек 2022 в 16:08

Спасибо за подробный отзыв. Таких нам пишут мало.

Отвечу так: в конце августа, в момент релиза SD, не было ничего, кроме консоли. Которая либо работала, либо нет. Та версия требовала 24гб видеопамяти и работала в 3-4 раза медленнее.

Что сейчас: минимум — 4гб, любая видеокарта, даже допотопная gtx980 справится (лучше все же 1070 и выше). Работает в 3 раза быстрее. Мы еще и интерфейс сделали, по мнению большинства блоггеров и пользователей, лучший на сегодня. И кроссплатформенные установщики. И оптимизации внутри.

Мы делаем это бесплатно, но если бы нам платили, стоимость разработки сейчас была бы около 150000 долларов. Не уверен, что при таких вложениях Инвок бы не стал коммерческим продуктом, но вам повезло — это открытый код.

Да, это продукт для early adopters. Вы либо разбираетесь и учитесь пользоваться последней доступной технологией, и даже помогаете в разработке, либо ждете коммерческого однокнопочного софта за деньги. Сейчас Инвок используют игровые студии, дизайнеры, менеджеры, художники, а мы собираем отклики о продукте и стараемся улучшить его для них. Остальные пользователи могут попробовать midjourney и dall-e — они примитивнее, но все сделают за них.

Если у вас что-то пошло не так, пожалуйста, напишите в гитхабе или дискорде о своем железе и ошибках — вам помогут.

Что касается мануалов, я замечаю, что англоязычные пользователи не испытывают проблем и называют наши руководства грамотными и просто написанными. Русскоязычным они кажутся запутанными. Я не уверен, что знаю, как это исправить. Возможно, вы нам поможете — перевести на русский, исправить проблемы со структурой и ссылками? Если захотите, гитхаб открыт — предложите улучшения и их обязательно добавят в следующем релизе.

Управление заголовками HTTP в Joomla 4 (часть 1)

netsvetaev 12 дек 2022 в 00:03

Ого, джумла еще жива! Использовал ее в 2006-2007 годах.

Релиз InvokeAI 2.2: универсальный холст, удобные установщики, автозагрузка моделей и DPM++

netsvetaev 7 дек 2022 в 01:50

Теоретически есть, практически мы пока не занимались этим.
Вроде бы, у новой версии установкщика есть файл для обновлений. Не уверен, сам пользуюсь ручной установкой. Но вряд ли вам понравится именно автоматическое обновление — вдруг все сломается? :-)

Я обучил нейросеть на своих рисунках и отдаю модель бесплатно (и научу вас делать это)

netsvetaev 6 дек 2022 в 10:52

Сожалею. Вероятно, скрипт сломался. Этот колаб был сделан на основе форка Automatic1111, на него в последнее время много жалоб. Я не имею отношения к самому колабу, ни к форку, поэтому помочь не могу. Но когда сделаем свой через Invoke, обновлю статью.

Я обучил нейросеть на своих рисунках и отдаю модель бесплатно (и научу вас делать это)

netsvetaev 6 дек 2022 в 10:09

Вас интересует только первая часть. Первая строка — ключ, которым вы вызываете стиль или объект. То, что вы будете вписывать в поле для генерации, чтобы получить что-то связанное с вашими исходниками.
Вторая строка — класс, как бы категори изображений. Если это фотографии, лучше написать photo. Но это не так важно.

Я обучил нейросеть на своих рисунках и отдаю модель бесплатно (и научу вас делать это)

netsvetaev 6 дек 2022 в 09:51

Но сейчас их несколько от разных разработчиков, какой-то другой может работать.

Я обучил нейросеть на своих рисунках и отдаю модель бесплатно (и научу вас делать это)

netsvetaev 6 дек 2022 в 09:51

Печально, еще пару недель назад им пользовался. Если вы уверены, что все сделали правильно до этого шага, это значит, что скрипт сломался, обновили его неудачно, видимо. Я не имею отношения к самому колабу, поэтому помочь не могу. Но когда сделаем свой через Invoke, обновлю статью.

Я обучил нейросеть на своих рисунках и отдаю модель бесплатно (и научу вас делать это)

netsvetaev 6 дек 2022 в 09:44

А, вы про обучение. ПРостите, перепутал ветки. Возможно, этот скрипт сломался. Но попробйте другой браузер — в сафари у меня не работала загрузка, в хроме работала.

Я обучил нейросеть на своих рисунках и отдаю модель бесплатно (и научу вас делать это)

netsvetaev 6 дек 2022 в 09:12

Перетягивание должно работать. Пожалуйста, создайте тему в дискорде или гитхабе, чтобы другие разработчики увидели и ответили (укажите свое железо) https://github.com/invoke-ai/InvokeAI/issues https://discord.com/channels/1020123559063990373/1020839635150188655

Релиз InvokeAI 2.2: универсальный холст, удобные установщики, автозагрузка моделей и DPM++

netsvetaev 5 дек 2022 в 18:24

Поле для негативного запроса многие хотят, потому что привыкли к Авто. Но это не лучший вариант, честно. Сейчас вы можете просто [писать негативные слова в скобках]. Чуть позже, вероятно, через месяц, мы добавим более интересный и удобный графический интерфейс для работы с запросами (с совместимостью с текстовым).
Глянуть у изображения текст — да, это клево (image to prompt). Проблема в точности определения ключевых слов: мы не нашли скрипт, который бы точно определял происходящее на картинке, то есть вы не получите из этих слов такую же картинку, если будете ее генерировать. Сейчас команда переводит все на hf diffusers, после этого и работать будет быстрее, и новые фичи подключать станет удобнее. Но Инвок сохраняет все настройки и запросы в EXIF и вы легко можете кинуть картинку, сделанную в нем в другой инвок и достать оттуда строки (use prompt в контекстном меню галереи или крайняя левая кнопка сверху). Или смотрите lexica.art — там много хороших изображений.
Нет, команда англоязычная и никого, живущего в России, у нас сейчас нет. Тут три особенности: размер русскоязычного сообщества и и вообще интереса к нейросетям крайне мал по сравнению с мировым; чтобы пользоваться SD, пользователи должны знать английский на достаточно для общения уровне (как иначе писать что-то для генерации?); с каждым новым релизом количество пользователей растет и для русскоязычной поддержки потребуется отдельная команда. Но многие приходят в дискорд, объясняют свои проблемы, как могут. В конце концов, для перевода есть deepl.

InvokeAI 2.2: UI Outpainting, Embedding Management and more

netsvetaev 4 дек 2022 в 17:21

модели использовать можно. Я не знаю о случаях, подобном вашему, но предлагаю:
1. Перерпроверить синтаксис добавленной модели, может там опечатка?
2. Импортировать через команду !import в консоли invoke.py — она делает то же, но по шагам. Если речь идет о .pt, концепте, а не о ckpt — отдельной модели, то есть команда embeddings (лучше уточнить в мануалах).
3. Попробовать другие модели
4. Подождать обновления Invoke — скоро мы добавим интерфейс для легкого добавления моделей.

Релиз InvokeAI 2.2: универсальный холст, удобные установщики, автозагрузка моделей и DPM++

netsvetaev 3 дек 2022 в 11:57

4гб, от нвидии 1070.

Релиз InvokeAI 2.2: универсальный холст, удобные установщики, автозагрузка моделей и DPM++

netsvetaev 3 дек 2022 в 11:56

Простите, я пишу об этом уже пару месяцев. Вот первый пост, там больше объяснений https://habr.com/en/post/693512/. Буду теперь добавлять абзац про форк.

Релиз InvokeAI 2.2: универсальный холст, удобные установщики, автозагрузка моделей и DPM++

netsvetaev 3 дек 2022 в 11:55

Мультиязычность на коленке организовать легко: подключить гугл-транслейт поверх. Кстати, некоторая часть русского языка в базе есть.

В рейтинге: Не участвует

Зарегистрирован: 9 июля 2014

Активность: 11 января 2024 в 18:03

UI/UX дизайнер, Менеджер продукта

Ведущий

От 3 500 €

HTML

CSS

Проектирование

UI/UX дизайн

Прототипирование

Дизайн мобильных приложений

Adobe Photoshop

Дизайн продукта

3d моделирование

Нейронные сети

Информация

Специализация