Artur Netsvetaev @netsvetaev
Product Manager, UI Designer, Entrepreneur
Information
- Rating
- Does not participate
- Registered
- Activity
Specialization
UI/UX Designer, Product Manager
Lead
From 3,500 €
HTML
CSS
Design
UI/UX design
Prototyping
Mobile application design
Adobe Photoshop
Product Design
3D modeling
Neural networks
Вы можете перенести контент (models, outputs), но питоновские библиотеки придется установить заново. Просто пропустите загрузку моделей на другом ПК и скопируйте файлы в новые пустые папки. При следующем запуске Инвок должен их увидеть и запуститься.
Аналогичным образом вы можете вынести контент за пределы папки invokeai и указать путь до моделей и генераций в конфиге или при установке.
задушили 2.0, когда отфильтровали по ошибке слишком много похожего на эротику. В 2.1 контент вернули. Но там используется другая ассоциативная модель и да, запросы нужно формировать иначе. Я и сам испытываю проблемы с этой версией, пока проще 1.5.
Спасибо за интересные вопросы!
Я не уверен, что этот гайд актуален сам по себе, некоторое время этот вариант не работал. Сейчас есть более интересные решения от runpod.io и, кажется, rundiffusion.
fp — это не совсем формат файла, скорее способ хранения информации и ее кодирования. Чем меньше, тем меньше файл, но хуже качество, но зато работает быстрее. В целом, между fp16 бит и fp32 бита разницы почти нет.
Конвертация в ckpt и обратно — не очень нужна в данный момент (если что, в последней версии InvokeAI есть конвертер туда и обратно). Просто ckpt был неким форматом по умолчанию, пока HF не сделали API diffusers со своим вариантом хранения. В теории (да и на практике уже) это гораздо лучше, чем ckpt.
Разрешение для обучения может быть любым. Например, для SD1.5 стандарт — 512px, но есть модели, обученные на 768x768. Сейчас я рекомендую обучать новые модели с помощью SD2.1 — и разрешение на входе выше, и детализация латентного пространства увеличилась, больше деталей сохраняется. Просто помните, что увеличение размера сделает обучение более медленным и привяжет вас к этому разрешению (делать картинки, отличные от установленного размера, можно, но результат будет менее предсказуемым, особенно, с меньшими размерами).
К сожалению, большей детализвции по умолчанию и совсем без ручной доработки вы вряд ли добьетесь, но, если обучить на изображениях типа 768x1024 и потом обработать генерации еще раз (img2img или hi-res fix), можно получить более точные результаты.
скорее всего, у вас не один питон. Это решаемо, переключите его на нужую версию.
Версия 2.2.4?
Я уже не помню, в чем беда — у некоторых он пропадает. Напишите в дискорд, пожалуйста https://discord.gg/FC5U4U2Q (и попробуйте там поискать)
Если бы написать кроссплатформенные установщики было так легко, то инструкции бы не потребовались. Вы правы, однако, в реальности возникает вопрос: как?
Задача следующая: заставить питон с виртуальным пространством со всеми зависимостями работать на четырех платформах в 5 комбинациях (win+nvidia/lin+nvidia+amd/macm1/mac86+amd/). А софтовых комбинаций и конкретных видеокарт еще больше.
Вы описываете то, что команда постаралась сделать: автоматическую установку через запуск одного файла. Сейчас это работает для большинства людей. Но чем больше пользователей, тем больше удивительных сочетаний железа и софта, которые почему-то не работают. Как все это сделать без багов и без инструкций на случай багов я решительно не понимаю (но я и не программист).
Помочь всем и сразу мы точно не можем, ПО без ошибок не существует. Однако, когда пользователи пишут об ошибках и своих конфигурациях, разработчики заинтересованы в решении их проблем и могут помочь и им, и всем другим с подобной ошибкой.
Спасибо за подробный отзыв. Таких нам пишут мало.
Отвечу так: в конце августа, в момент релиза SD, не было ничего, кроме консоли. Которая либо работала, либо нет. Та версия требовала 24гб видеопамяти и работала в 3-4 раза медленнее.
Что сейчас: минимум — 4гб, любая видеокарта, даже допотопная gtx980 справится (лучше все же 1070 и выше). Работает в 3 раза быстрее. Мы еще и интерфейс сделали, по мнению большинства блоггеров и пользователей, лучший на сегодня. И кроссплатформенные установщики. И оптимизации внутри.
Мы делаем это бесплатно, но если бы нам платили, стоимость разработки сейчас была бы около 150000 долларов. Не уверен, что при таких вложениях Инвок бы не стал коммерческим продуктом, но вам повезло — это открытый код.
Да, это продукт для early adopters. Вы либо разбираетесь и учитесь пользоваться последней доступной технологией, и даже помогаете в разработке, либо ждете коммерческого однокнопочного софта за деньги. Сейчас Инвок используют игровые студии, дизайнеры, менеджеры, художники, а мы собираем отклики о продукте и стараемся улучшить его для них. Остальные пользователи могут попробовать midjourney и dall-e — они примитивнее, но все сделают за них.
Если у вас что-то пошло не так, пожалуйста, напишите в гитхабе или дискорде о своем железе и ошибках — вам помогут.
Что касается мануалов, я замечаю, что англоязычные пользователи не испытывают проблем и называют наши руководства грамотными и просто написанными. Русскоязычным они кажутся запутанными. Я не уверен, что знаю, как это исправить. Возможно, вы нам поможете — перевести на русский, исправить проблемы со структурой и ссылками? Если захотите, гитхаб открыт — предложите улучшения и их обязательно добавят в следующем релизе.
Ого, джумла еще жива! Использовал ее в 2006-2007 годах.
Теоретически есть, практически мы пока не занимались этим.
Вроде бы, у новой версии установкщика есть файл для обновлений. Не уверен, сам пользуюсь ручной установкой. Но вряд ли вам понравится именно автоматическое обновление — вдруг все сломается? :-)
Сожалею. Вероятно, скрипт сломался. Этот колаб был сделан на основе форка Automatic1111, на него в последнее время много жалоб. Я не имею отношения к самому колабу, ни к форку, поэтому помочь не могу. Но когда сделаем свой через Invoke, обновлю статью.
Вас интересует только первая часть. Первая строка — ключ, которым вы вызываете стиль или объект. То, что вы будете вписывать в поле для генерации, чтобы получить что-то связанное с вашими исходниками.
Вторая строка — класс, как бы категори изображений. Если это фотографии, лучше написать photo. Но это не так важно.
Но сейчас их несколько от разных разработчиков, какой-то другой может работать.
Печально, еще пару недель назад им пользовался. Если вы уверены, что все сделали правильно до этого шага, это значит, что скрипт сломался, обновили его неудачно, видимо. Я не имею отношения к самому колабу, поэтому помочь не могу. Но когда сделаем свой через Invoke, обновлю статью.
А, вы про обучение. ПРостите, перепутал ветки. Возможно, этот скрипт сломался. Но попробйте другой браузер — в сафари у меня не работала загрузка, в хроме работала.
Перетягивание должно работать. Пожалуйста, создайте тему в дискорде или гитхабе, чтобы другие разработчики увидели и ответили (укажите свое железо) https://github.com/invoke-ai/InvokeAI/issues https://discord.com/channels/1020123559063990373/1020839635150188655
Поле для негативного запроса многие хотят, потому что привыкли к Авто. Но это не лучший вариант, честно. Сейчас вы можете просто [писать негативные слова в скобках]. Чуть позже, вероятно, через месяц, мы добавим более интересный и удобный графический интерфейс для работы с запросами (с совместимостью с текстовым).
Глянуть у изображения текст — да, это клево (image to prompt). Проблема в точности определения ключевых слов: мы не нашли скрипт, который бы точно определял происходящее на картинке, то есть вы не получите из этих слов такую же картинку, если будете ее генерировать. Сейчас команда переводит все на hf diffusers, после этого и работать будет быстрее, и новые фичи подключать станет удобнее. Но Инвок сохраняет все настройки и запросы в EXIF и вы легко можете кинуть картинку, сделанную в нем в другой инвок и достать оттуда строки (use prompt в контекстном меню галереи или крайняя левая кнопка сверху). Или смотрите lexica.art — там много хороших изображений.
Нет, команда англоязычная и никого, живущего в России, у нас сейчас нет. Тут три особенности: размер русскоязычного сообщества и и вообще интереса к нейросетям крайне мал по сравнению с мировым; чтобы пользоваться SD, пользователи должны знать английский на достаточно для общения уровне (как иначе писать что-то для генерации?); с каждым новым релизом количество пользователей растет и для русскоязычной поддержки потребуется отдельная команда. Но многие приходят в дискорд, объясняют свои проблемы, как могут. В конце концов, для перевода есть deepl.
модели использовать можно. Я не знаю о случаях, подобном вашему, но предлагаю:
1. Перерпроверить синтаксис добавленной модели, может там опечатка?
2. Импортировать через команду !import в консоли invoke.py — она делает то же, но по шагам. Если речь идет о .pt, концепте, а не о ckpt — отдельной модели, то есть команда embeddings (лучше уточнить в мануалах).
3. Попробовать другие модели
4. Подождать обновления Invoke — скоро мы добавим интерфейс для легкого добавления моделей.
4гб, от нвидии 1070.
Простите, я пишу об этом уже пару месяцев. Вот первый пост, там больше объяснений https://habr.com/en/post/693512/. Буду теперь добавлять абзац про форк.
Мультиязычность на коленке организовать легко: подключить гугл-транслейт поверх. Кстати, некоторая часть русского языка в базе есть.