Как стать автором
Обновить

Просто о Stable Diffusion: никакой магии

Уровень сложности Простой
Время на прочтение 14 мин
Количество просмотров 7.3K

Если вы не провели последние два года на ферме в Сибири, вы, вероятно, слышали о Stable Diffusion или пробовали генерировать изображения с помощью моделей, вроде Dall-e или Midjourney. Они становятся все лучше каждый день, и по качеству уже сравнимы с людьми, а во многих аспектах даже лучше (например, им не нужно платить).

Исследования в области создания видео уже идут полным ходом во многих лабораториях и компаниях, так что это лишь вопрос времени, когда генеративные модели сместят людей с очередного столпа на котором держится наше общества — порно. Я не вижу чтобы кто то поднимал тревогу об огромном количестве людей, которые потеряют работу из-за этого. Я не такой бессердечный, поэтому, прежде чем наступил этот печальный момент, я решил принять меры и создать базовое руководство, которое даже работник индустрии для взрослых сможет понять и использовать, чтобы оставаться в игре. Давайте посмотрим, что к чему.

Читать далее
Всего голосов 50: ↑40 и ↓10 +30
Комментарии 27

Как бесплатно генерить картинки в Dall-E через ChatGPT 4

Уровень сложности Простой
Время на прочтение 2 мин
Количество просмотров 41K

Введение:

- обычный ChatGPT 3.5 работает тут https://chat.openai.com, но для генерации картинок нужен Dall-E 3 отсюда https://openai.com/dall-e-3 и желательно ChatGPT 4 (правильно осознать ваш креативный запрос), а они доступны только по премиум подписке (for Plus and Enterprise users) за 20 долларов в месяц

- чтобы обойти это ограничение, воспользуемся бескорыстием Microsoft, вложившей в OpenAI (разработчика ChatGPT) больше 13 млрд долларов для развития своего поисковика Bing 

- Bing предоставляет доступ одновременно и к ChatGPT 4 и к Dall-E 3, но через браузер Microsoft Edge и при наличии учётной записи Microsoft

Подготовка:

- создайте учётную запись в Microsoft https://signup.live.com/signup?lic=1

(если учётка уже существует, от Skype, например, пропустите этот шаг и найдите логин и пароль)

- скачайте браузер Edge https://www.microsoft.com/ru-ru/edge/download?form=MA13FW

(если браузер уже скачан, пропустите шаг)

Процесс:

- открываем браузер Edge и логинемся в нём с учётной записью Microsoft

- скачиваем VPN-плагин для браузера Edge, например, по ссылке далее и активируем его https://microsoftedge.microsoft.com/addons/detail/browsec-vpn-%D0%B1%D0%B5%D1%81%D0%BF%D0%BB%D0%B0%D1%82%D0%BD%D1%8B%D0%B9-/fjnehcbecaggobjholekjijaaekbnlgj

- открываем в браузере Edge ссылку https://www.bing.com/search?q=Bing+AI&showconv=1 и сохраняем ее в избранном

- если увидите три плашки "Творческий", "Сбалансированный" и "Точный" в разделе "Выбор стиля беседы" и строку запроса как в мессенджере в нижней части экрана, значит всё получилось (если видите "обычный" поиск Bing с разными ссылками типа "Новости о Bing AI",  "Что такое Bing" и строку запроса в верхней части экрана, значит что-то не получилось)

Читать далее
Всего голосов 24: ↑14 и ↓10 +4
Комментарии 62

OpenAI представила генератор изображений DALL-E 3, который будет включён в ChatGPT

Время на прочтение 2 мин
Количество просмотров 8.4K

OpenAI представила новую версию своего генератора изображений DALL-E и объявила о планах интегрировать её в ChatGPT. Разработчики обещают, что DALL-E 3 будет лучше понимать промты и анализировать сложные инструкции, а не смешивать разные элементы подробного запроса, и генерировать «чрезвычайно детальные и точные изображения». У пользователей также появилась возможность составлять промты с помощью ChatGPT.

Читать далее
Всего голосов 12: ↑12 и ↓0 +12
Комментарии 8

DALL-E 3 заработала в Paint для всех пользователей Windows 11

Время на прочтение 1 мин
Количество просмотров 26K

Microsoft открыла доступ к нейросети DALL-E 3 в Paint для всех пользователей Windows 11. С её помощью можно генерировать изображения в Paint через функцию Cocreator.

Функция Cocreator в Windows 11 доступна с сентября по каналам Canary и Dev, а недавно она появилась на канале Release Preview. Начиная с этой недели попробовать DALLE-3 в Microsoft Paint может любой пользователь Windows 11.

Читать далее
Всего голосов 30: ↑29 и ↓1 +28
Комментарии 14

Meta¹ показала генеративную нейросеть CM3leon для работы с изображениями

Время на прочтение 5 мин
Количество просмотров 1.4K
Компания Meta¹ рассказала о CM3leon, нейросетевой модели для преобразования текста в изображения, изображений в текст и других подобных задач. CM3leon превосходит схожие продукты: из-за отличий в само́й архитектуре продукта возможно количество параметров в два с лишним раза выше, чем в DALL-E 2, а в процессе тренировки потребовалось в 5 раз меньше вычислительной мощности, чем у конкурентов.

Meta¹ лишь заявила о CM3leon. Код проекта, файлы моделей или хотя бы API для тестирования не выпущены.
Читать дальше →
Всего голосов 6: ↑6 и ↓0 +6
Комментарии 0

Видеосказки от ИИ: разбор бейзлайна трека Creative AI в рамках AIIJC

Время на прочтение 9 мин
Количество просмотров 2.8K

Привет, Хабр!

Сегодня мы, команда Sber AI, расскажем про бейзлайн генерации сказок с озвучкой и картинками, который мы предложили в рамках трека по Creative AI международного соревнования для школьников Artificial Intelligence International Junior Contest (AIIJC): рассмотрим аспекты обучения conditional ruGPT-3, генерацию музыки, генерацию изображения по текстовой строке, а также обсудим некоторые проблемы, с которыми пришлось столкнуться во время обучения и дообучения моделей.

В этом посте мы хотим разобрать (и разобраться сами), как можно использовать и объединять генеративные (и не только) модели для решения одной большой задачи — генерации контента. Мы подобрали большое количество материалов про каждую конкретную модель, чтобы ими можно было пользоваться сразу.

Читать далее
Всего голосов 9: ↑8 и ↓1 +7
Комментарии 7

Как мы тестировали и дообучали одну из самых хайповых разработок года

Время на прочтение 5 мин
Количество просмотров 4.9K

 

Всем привет!

Всё началось с того, что мы в Sber AI решили немного поизучать/почитать подробнее про хайповую нейронную сеть DALL·E и понять её потенциал возможностей, а также в чём заключается боттлнек – что же мешает генерить картинки хорошего качества и как можно попытаться улучшить работу модели?

Читать далее
Всего голосов 5: ↑4 и ↓1 +3
Комментарии 6

Нейросеть DALL-E 2 создала собственный язык: правда, не совсем, и совсем не?

Время на прочтение 9 мин
Количество просмотров 37K

1 июня 2022 года вышла статья Янниса Дараса и Александроса Димакиса из Техасского университета в Остине, названная «Открытие скрытого словарного запаса DALLE-2» (Discovering the Hidden Vocabulary of DALLE-2). Она произвела небольшой фурор в сети, заполнившейся заголовками «нейросеть создала свой язык!» — но, увы, не вполне заслуженно.

Для начала — пару слов о том, что из себя представляют генераторы изображений серии DALL-E вообще, и DALLE-2 в частности. Точнее, DALL·E 2 (через точку и пробел). Так называется выпущенная в начале апреля в ограниченный доступ — нейросеть, позволяющая генерировать изображения по запросам на английском языке. Как и первую DALL·E, её создала американская компания OpenAI, связанная с Илоном Маском и занимающаяся разработками в сфере нейросетей и самообучающегося искусственного интеллекта.
Читать дальше →
Всего голосов 66: ↑65 и ↓1 +64
Комментарии 14

ИИ DALL E mini склонен генерировать женщин в сари

Время на прочтение 5 мин
Количество просмотров 7K

В ответе на пустой запрос ставшая вирусной DALL E mini часто генерирует фото женщин в сари. Почему? Пытаемся разобраться под катом к старту флагманского курса по Data Science.

Читать далее
Всего голосов 6: ↑6 и ↓0 +6
Комментарии 7

Как работают нейронные генераторы картинок (в формате ELI5)

Время на прочтение 9 мин
Количество просмотров 15K

Хочу очень кратко рассказать, на каких принципах построены современные нейронные генераторы картинок, чтобы немножко разбавить флёр волшебства и магии, который окружает публичное обсуждение результатов их работы. Для того, чтобы понимать перспективы собственных профессий в мире, где похожие генераторы производят вообще все виды электронных артефактов (видео, тексты, программы, 3D-модели и так далее), – а этот мир нас, безусловно, ожидает в самом ближайшем будущем – надо понимать, что за генерацией стоит довольно простая математика на основе данных, которые ввели клавиатурой и мышкой и закачали в интернет люди.

(Должен сразу предупредить, что для специалистов текст окажется может оказаться смехотворным. Например, я полностью опускаю детали применения градиентного спуска при обучении, вообще не упоминаю слои в нейронках, уже не говоря о развёртках или там, рекурренции. Также я ловко обхожу вопрос довольно значительного различия между классической многослойной архитектурой и трансформерами. Мне кажется, что это детали реализации, хотя в них, конечно, и вложены мегалитры программистской крови. В общем, если вы работаете в этой области, то вам может быть не очень интересно, зато мне будет интересно прочитать ваши комментарии, чтобы улучшить статью и сделать её ещё более простой и понятной.)

Читать далее
Всего голосов 24: ↑24 и ↓0 +24
Комментарии 1

Почему нейросеть DALL-E не отнимет мою работу иллюстратором

Время на прочтение 6 мин
Количество просмотров 29K

Наконец-то я смог протестировать DALL-E. И я могу заверить вас, что невозможно сгенерировать профессиональные и пригодный изображения из текстового описания. Вот мои попытки заниматься творчеством с помощью нейросети.

Я профессиональный иллюстратор и художник-раскадровщик уже десять лет, работаю в основном в рекламной сфере и кино. Я был очень напуган, начав читать все эти статьи о DALL-E и Midjourney, в которых говорилось, что ИИ отнимет мою работу иллюстратором. Но когда я ознакомился с тем, как работают нейросети, то стал более скептически к этому относиться. Поэтому я зарегистрировался в очереди и, наконец, получил возможность самому ими воспользоваться, чтобы посмотреть, получится ли у меня воспроизвести с помощью искусственного интеллекта то, чем я зарабатываю на жизнь.

Читать далее
Всего голосов 88: ↑83 и ↓5 +78
Комментарии 218

Как работает DALL-E

Уровень сложности Средний
Время на прочтение 9 мин
Количество просмотров 18K

В Январе 2021 года Open AI показали DALL-E, генерирующую любые изображения по текстовому описанию, на хабре уже успели разобрать тему генерации изображений нейросетями, но мне захотелось разобраться в теме более детально и показать всё в коде.

Сейчас мы разберём, как работает Text2Image нейросеть DALL-E, посмотрим на хардкор математики, а также убедимся, что это сможет повторить каждый, написав реализацию DALL-E почти с нуля.
Читать дальше →
Всего голосов 45: ↑42 и ↓3 +39
Комментарии 1

Будущее индустрии ИИ стоит на бесплатной базе данных простого учителя школы

Время на прочтение 9 мин
Количество просмотров 20K

Перед небольшим загородным домом на окраине Гамбурга в северной Германии на почтовом ящике карандашом нацарапано единственное слово — «ЛАЙОН». Это единственный признак того, что этот дом принадлежит человеку, стоящему за огромными усилиями по сбору данных, и без которого тот бум искусственного интеллекта, который во всю силу происходит сейчас, мог бы и не случиться.

Читать далее
Всего голосов 31: ↑28 и ↓3 +25
Комментарии 14

Художники против нейросетей: справедливый протест или неолуддизм?

Время на прочтение 14 мин
Количество просмотров 37K

В 2022 году изображения, сгенерированные нейросетями, были примерно везде. Часть аудитории они успели изрядно подзадолбать, но в целом подборки всё более причудливых изображений продолжают уверенно собирать тонны лайков и репостов почти на всех площадках. Однако отнюдь не все были рады происходящему.

Пока соцсети продолжали заполняться терабайтами изображений, сгенерированных Midjourney и её «коллегами», в декабре 2022 года в международном сообществе цифровых художников началась акция протеста в стиле киберпанк: художники на этой и на других платформах массово возмутились распространением изображений, созданных нейросетями.
Читать дальше →
Всего голосов 96: ↑93 и ↓3 +90
Комментарии 574

Как мы используем нейросети для создания рекламных материалов

Время на прочтение 5 мин
Количество просмотров 13K

Привет! Меня зовут Роман Максимов, я руководитель группы дизайна в Омни СМ. Наша группа входит в отдел цифрового дизайна и занимается диджитал- и веб-дизайном интернет-магазина «Спортмастер» и сайтов монобрендов. Если совсем коротко, то мы отвечаем за всё, что связано с визуальной и креативной составляющей — баннеры, дизайн заглавных страниц, лендингов, видео и всю графическую маркетинговую составляющую.

В этом посте я расскажу про то, как мы используем возможности нейронных сетей, чтобы создавать рекламные материалы и не только.

Итак, про нейронки. Тема уже в целом не новая, но с каждым витком развития получает неплохой импульс в плане актуальности. Крупные компании стали объединять усилия в области генеративного дизайна — Shutterstock запартнёрились с DALL-E, и в будущем можно будет не тратить кучу времени, копаясь в огромном каталоге картинок, а просто взять и написать в поисковой строке нужный запрос. Сеть его обработает и нарисует для подходящую картинку. Если не очень подходящую — просто уточни запрос. 

Читать далее
Всего голосов 16: ↑15 и ↓1 +14
Комментарии 5

«Я нашел художника-волшебника» — как нейросети уже отбирают работу у художников

Время на прочтение 3 мин
Количество просмотров 16K

Пока мы спорили отнимут ли у кого-то нейросети работу, это уже фактически произошло. Одна из крупнейших фриланс бирж fiverr.com добавила специальный раздел, в котором можно заказать услуги, сделанные с использованием нейросетей.

Узнать в чем тут дело
Всего голосов 12: ↑11 и ↓1 +10
Комментарии 23

Security Week 2307: утечка обучающих датасетов из нейросетей

Время на прочтение 3 мин
Количество просмотров 2.2K
Исследователи из университетов США и Швейцарии опубликовали научную работу, в которой исследуется утечка данных, используемых для обучения нейросетей. Конкретно изучались диффузионные модели, а большинство экспериментов проводились с разработками Stable Diffusion и Imagen, генерирующими картинки по текстовому запросу. Для них было показано несколько вариантов атак, в результате которых генерируется не «новое» изображение, а практически идентичная копия картинки из обучающего датасета.



Исследование вносит вклад в общее обсуждение этичности использования авторских изображений для обучения нейросетей. В середине января несколько художников даже подали иск к создателям подобных сервисов, в котором, в частности, как источник проблем упоминается Stable Diffusion. Новые методы, провоцирующие утечки обучающих изображений, могут использоваться как для выведения сервисов «на чистую воду», так и для улучшения защиты исходных картинок разработчиками. В некоторых случаях, когда в датасетах содержится приватная информация, исключить утечки может быть особенно важно.
Читать дальше →
Всего голосов 7: ↑7 и ↓0 +7
Комментарии 8

Андрей Карпаты. Software 2.0. Непонятный софт будущего

Уровень сложности Средний
Время на прочтение 6 мин
Количество просмотров 19K

Когда мы говорим о современных разработках в области нейросетей и машинного обучения, то первое имя, которое приходит на ум — это Андрей Карпаты. Молодой словак быстро стал звездой в данной области и одним из главных авторитетов по части конкретного программирования систем. Это тот человек, который обучал Джона Кармака, в частности.

Андрей Карпаты — сооснователь компании OpenAI (GPT-4, ChatGPT) и ведущий разработчик автопилота Tesla. Впрочем, из «Теслы» он недавно ушёл по очевидной причине: есть вероятность, что человечество стоит на пороге грандиозного открытия, с которым ничто не сравнится по важности — оно разделит историю нашего вида на до и после сингулярности. Речь идёт об AGI, то есть ИИ общего назначения. Если так, то сейчас нет смысла работать больше ни над чем.
Читать дальше →
Всего голосов 66: ↑61 и ↓5 +56
Комментарии 30

Microsoft предоставит доступ к технологиям OpenAI всем пользователям своего облачного сервиса Azure

Время на прочтение 1 мин
Количество просмотров 1.9K

Microsoft открыла доступ к сервису Azure OpenAI, который даёт пользователям возможность интегрировать ИИ-инструменты в свои продукты. Компании получат доступ к ИИ-моделям OpenAI, включая GPT-3.5, Codex и DALL-E. Кроме того, скоро в сервисе будет доступен чат-бот ChatGPT, добавил в Twitter гендиректор Microsoft Сатья Наделла.

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 0

Kwalee будет поощрять сотрудников за идеи для ИИ-инструментов типа ChatGPT, Dall-E и Midjourney

Время на прочтение 1 мин
Количество просмотров 385

Британский издатель игр Kwalee заявил о создании программы для сотрудников Kwalee Artificial Intelligence (KAI). Эта программа позволяет любому сотруднику компании предлагать идеи, как можно использовать искусственный интеллект для повышения производительности на рабочем месте или внедрения инноваций в будущие игры.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 0
1