Pull to refresh

Невероятный искусственный интеллект Easy Diffusion 3.0

Level of difficultyEasy
Reading time95 min
Views8.3K

Введение

"Разум — самое важное явление во Вселенной; он способен выходить за границы физических законов и трансформировать мир. Человеческий разум позволил нам преодолеть ограничения нашей биологической природы и изменить самих себя." — Рэй Курцвейл. «Эволюция разума».

Удивительный мир искусственного интеллекта может нам открыться в полной мере лишь тогда, когда мы с вами cможем увидеть положительные результаты его работы, особенно созданные при нашем непосредственном участии. Эти результаты должны быть понятны и объяснимы каждому человеку, а также они должны быть этичны, непредвзяты и не нарушать закон.

На сегодняшний день искусственный интеллект может делать многое, например: написать текст нового стихотворения или даже целого рассказа, воспроизвести его различными голосами знаменитых актеров или музыкантов, проанализировать большое количество числовых данных и составить прогноз на будущее, играть с нами или сразу с тысячью людей в компьютерные игры. Пожалуй, самое впечатляющее, на мой взгляд, то, что может делать искусственный интеллект сегодня – это создавать уникальные и невероятные изображения. Эти изображения могут быть воплощением трехмерного мира фантастического будущего в компьютерной игре или быть виртуальной симуляцией окружающего нас мира. Изображения могут быть трехмерными или двумерными, а также могут быть выполнены в различных стилях живописи знаменитых художников разных периодов времени. Но самое интересное то, что на этих изображениях могут появиться существа или предметы, не существующие в нашем мире.

В этой книге вы приобретете для себя новые знания о том, насколько может быть многообразен искусственный интеллект, познакомитесь с его наиболее популярными терминами и определениями. Вы узнаете, что такое «искусственный сверхинтеллект», «узкий искусственный интеллект», «дружественный искусственный интеллект», «человеко-ориентированный искусственный интеллект», «распределенный искусственный интеллект», «доверенный искусственный интеллект», «композитный искусственный интеллект», «объяснимый искусственный интеллект» и многое другое.

Я расскажу вам, как можно трансформировать и визуализировать полученные вами знания с помощью системы искусственного интеллекта, превратив текст определений различных терминов из этой книги в фантастические рисунки.

Для того чтобы все это воплотить в жизнь, мы с вами изучим работу бесплатной программы – системы генеративного искусственного интеллекта Easy Diffusion. Эта программа создает фотореалистичные изображения из текстовых запросов и графических изображений.

Easy Diffusion – это простая к установке сборка (дистрибутив) системы искусственного интеллекта Stable Diffusion. Easy Diffusion позволит нам создать уникальные изображения на базе самых популярных на сегодняшний день нейросетевых моделей, таких как Stable Diffusion, Midjourney, OpenJourney, DreamShaper, SDXL Yamer’s Realism!, ProtoVision XL, Art Universe, Realistic Vision и множества других.

С помощью этой книги вы научитесь не только пользоваться искусственным интеллектом Easy Diffusion как инструментом творчества, но и самостоятельно сможете установить, настроить и удалить эту программу на своем компьютере, подключить к ней различные дополнительные модули, которые значительно расширят ее возможности по созданию и обработке изображений.

При помощи искусственного интеллекта вы научитесь создавать уникальные и неповторимые изображения, которые вы сможете использовать в своей учебе или для развлечений.

Чтобы быть объективным в своей работе и сделать книгу максимально доступной широкому кругу читателей, я попросил своего сына Всеволода (ученика 5 класса) и свою дочь Диану (ученицу 8 класса) помочь мне в работе над учебным пособием и создать различные изображения, отражающие суть определений искусственного интеллекта, представленных в книге. Мне было интересно привлечь их к новому для них виду деятельности, а также очень важно понять самому, как быстро они научатся работать с системой искусственного интеллекта Easy Diffusion и смогут создавать свои собственные качественные изображения.

Оказалось, что пятнадцати минут инструктажа было достаточно для того, чтобы приступить к их первому знакомству с искусственным интеллектом Easy Diffusion и познакомиться с работой модели «Realistic Vision». Первым их изображением стал хомяк в стиле «steampunk». Стимпанк – это направление научной фантастики, включающее технологию и декоративно-прикладное искусство, вдохновлённое технологиями и фантастикой XIX века[1]. Тем не менее более или менее серьезный опыт работы с Easy Diffusion у них появился спустя некоторое время.

На то, чтобы наполнить эту книгу иллюстрациями, у нас ушло более шести недель работы. Из более чем пятисот рисунков мы отобрали для вас самые, на наш взгляд, впечатляющие и интересные. Общее машинное время, которое мы затратили на работу с искусственным интеллектом Easy Diffusion, равно приблизительно тремстам шестидесяти часам. Что уж готовить о том, что на написание самой книги, корректировку и редактирование текста, а также подбор нужных картинок потребовалось не мало времени и сил.

С того времени, как было опубликовано первое издание этой книги, прошло почти полгода. За это время с первым тиражом этой книги познакомились более семнадцати тысяч читателей. С того момента также изменилась и версия программы Easy Diffusion.

Эта книга написана как учебное пособие для школьников средних и старших классов. Она содержит в себе подробную инструкцию по работе с системой искусственного интеллекта Easy Diffusion 3.0, которая позволяет преобразовать написанный вами текст или ваше изображение в новое уникальное изображение. Также она содержит познавательную информацию о существующих видах искусственного интеллекта. В книге представлен прекрасный набор из более чем ста иллюстраций, демонстрирующих возможности искусственного интеллекта Easy Diffusion 3.0.

Мы (я и мои дети) очень надеемся, что наш позитивный и положительный опыт, который мы получили в процессе изучения системы искусственного интеллекта Easy Diffusion, будет полезен вам в вашей учебе и творчестве.

Приятного вам чтения и продуктивной работы!

Шаг 1. Самые популярные программы

На сегодняшний день существует достаточно большое количество различных программ, которые на базе технологий искусственного интеллекта создают невероятно красивые изображения.

На мой взгляд, наибольшей популярностью пользуются следующие программы:

·        Midjourney – очень популярная система искусственного интеллекта, созданная одноименной компанией Midjourney. Искусственный интеллект Midjourney – это web-сервис в сети Интернет, который позволяет создавать очень красивые изображения, при этом не задействуя вычислительные ресурсы вашего компьютера. Для ее использования у вас должна быть установлена программа Discord – удобный мессенджер для групповой работы, который часто используют игроки по всему миру. Основной недостаток программы заключается в том, что не так давно Midjourney стала полностью платной.

Сайт программы:

https://www.midjourney.com

·        Leonardo.Ai – это красочный web-сервис в сети Интернет, предоставляющий доступ к одноименной нейросети Leonardo.Ai. С ее помощью вы можете создавать изображения из текста и других изображений. К достоинствам Leonardo.Ai можно отнести удобный в использовании интерфейс работы. К недостаткам – это ограничение на число создаваемых изображений в день. Изображения создаются очень быстро и качественно, но пока вы научитесь делать что-то качественное, пройдет достаточно много времени. Если вы захотите потратить больше времени на работу с этой программой, готовьтесь заплатить за ее сервисы. Очень часто Leonardo.Ai сравнивают с Midjourney, но кто из них лучше – это решать только вам.

Сайт программы:

https://leonardo.ai

·        Dreamstudio.ai – это web-сервис, созданный компанией Stability AI, которая разработала одну из самых известных нейросетей или, как еще говорят, «моделей» под названием Stable Diffusion. Web-сервис очень удобный и позволяет создавать любые изображения очень быстро. Это происходит потому, что сервис «Dreamstudio.ai» использует очень мощные компьютеры, предоставляемые компанией Stability AI. Другими словами, ваш компьютер не задействуется в процессе создания изображений, что является существенным достоинством программы. В то же время недостатком использования Dreamstudio.ai является ограничение на число создаваемых картинок.

Сайт программы:

https://beta.dreamstudio.ai/dream

·        Stable Diffusion Web UI – это программа с web-интерфейсом, которую вы можете установить непосредственно на свой компьютер. К ее достоинствам можно отнести то, что это полностью бесплатный вариант использования модели Stable Diffusion. В программе можно выбрать гибкие настройки для улучшения качества изображения и его преобразования в новую версию или создания на ее основе другого изображения. К недостаткам можно отнести некоторые трудности, связанные с установкой и необходимостью наличия у вас дополнительных знаний о программах, необходимых для ее работы (например, таких как Python и Git). Stable Diffusion можно рекомендовать всем тем пользователям, кто уже получил большой опыт работы с Easy Diffusion.

Сайты программы:

https://github.com/AUTOMATIC1111/Stable-diffusion-webui

https://www.python.org/downloads/windows/

https://git-scm.com/download/win

https://Stablediffusionweb.com/#demo

·        Stablecog – это очень простой в использовании, но в то же время очень интересный web-сервис. К сожалению, он платный. Тем не менее в день можно создать двадцать бесплатных изображений. Мне он понравился тем, что из десяти моделей можно выбрать две, созданные нашими соотечественниками. Эти модели называются Kandinsky и Kandinsky 2.2. Кроме того, можно увеличить разрешение созданной картинки в четыре раза (например, с 1248х832 до 4992х3328).

Сайт программы:

https://stablecog.com/generate

·        Easy Diffusion – полностью бесплатная система искусственного интеллекта, которая объединила в себе возможности использования Midjourney и Stable Diffusion. Easy Diffusion предлагает вам удобный и простой web-интерфейс, который позволяет не только создавать очень красивые изображения, но и подключать к ее работе различные дополнительные модули и модели. По умолчанию в программе уже предустановлена нам известная модель Stable Diffusion. Дополнительно вы можете скачать с сайта www.civitai.com много других моделей, включая модель «Openjourney», которая позволит вам заменить использование Midjourney. К еще одному достоинству программы можно отнести то, что она очень просто устанавливается на компьютер или ноутбук и работает с не очень мощными видеокартами. К недостатку программы можно отнести только затрачиваемое вами время на создание изображений. Например, если изображение в «Dreamstudio.ai» создается за 20 секунд, то в Easy Diffusion на создание может уходить до 120 секунд.

Еще раз обращу ваше внимание на то, что Easy Diffusion – это простая к установке сборка программных пакетов (или, другими словами, дистрибутив) системы искусственного интеллекта Stable Diffusion для различных операционных систем. Тут и далее я буду говорить не о Stable Diffusion, а именно Easy Diffusion по причине того, что именно с этим дистрибутивом и программой мы будем работать.

Сайт программы (дистрибутива программы):

https://github.com/easydiffusion/easydiffusion

Шаг 2. Установка Easy Diffusion

Для того, чтобы нам установить программу Easy Diffusion, переходим по следующей ссылке и скачиваем нужный дистрибутив для установленной у нас операционной системы (MS Windows, Linux или MacOS):

 https://github.com/easydiffusion/easydiffusion

На странице программы есть три дистрибутива:

·        Для операционной системы MS Windows.

·        Для операционной системы Linux.

·        Для операционной системы MacOS.

Прежде, чем устанавливать программу, обратите, пожалуйста, свое внимание на минимальные требования к вашему компьютеру. У вас должны быть установлены:

·        Видеокарта от компании NVIDIA с 2 Гигабайтами оперативной памяти (лучше с 4 Гигабайтами). Видеокарта на ноутбуке подойдет, но имейте в ввиду, что у вас должны быть установлены самые последние драйвера не только на видеокарту, но и на все компоненты системы MS Windows.

·        Минимальное количество оперативной памяти компьютера – 8 Гигабайт.

·        Минимальное количество дискового пространства (либо на диске «C:\», либо на любом другом диске) – 40 Гигабайт (25 – для Easy Diffusion и 15 – для моделей). Рекомендую устанавливать программу на флэш-диск компьютера (не внешний, а внутренний диск компьютера или ноутбука). С ним создание изображений будет происходить быстрее.

Далее мы будем рассматривать установку Easy Diffusion на компьютер с операционной системой MS Windows.

Прежде, чем производить установку, вам необходимо убедиться в том, что у вас в системе MS Windows все в порядке. Для этого вам нужно нажать правую кнопку мыши на значке «Мой компьютер» и выбрать из контекстного меню команду «Управление». Откроется программа «Управление компьютером», и в разделе «Диспетчер устройств» вы увидите не только все устройства вашего компьютера, но и статус их работы. Если есть неисправность какого-либо из устройств, нужно установить новые драйвера для данного устройства. Найти их можно в сети Интернет.

Разобравшись с тем, все ли у нас в порядке и соответствует ли ваш компьютер минимальным системным требованиям, скачиваем программу Easy- Diffusion-Windows.

После загрузки файла с именем Easy-Diffusion-Windows запускаем установку и жмем кнопку «Next»:

Соглашаемся с лицензионным договором и жмем кнопку «I Agree»:

Еще раз жмем кнопку «I Agree»:

Выбираем диск, на который будет установлена программа. Основная рекомендация в том, чтобы программа располагалась в корне диска, то есть она должна быть установлена на диске, но не внутри других папок, а только в свою собственную.

Например, на диске C:\ EasyDiffusion\, как показано на рисунке ниже:

Или на диске D:\EasyDiffusion\, как показано на рисунке ниже:

Выбираем нужный вам диск и жмем кнопку «Install» («Установить»).

Процесс установки и распаковки файлов на ваш компьютер начался:

Процесс установки занимает некоторое время.

Программа во время этого процесса установит все необходимые файлы и модели для работы, в том числе установит модель Stable Diffusion (версия 1.5), с помощью которой вы будете создавать свои первые произведения компьютерного искусства:

Также будут установлены и другие вспомогательные модели (например, GFPGAN-модель, Real-ESRGAN-модель и др.), которые используются Easy Diffusion для улучшения создаваемых вами изображений.

В конце процесса будет установлена CLIP-модель, которая позволяет определить, насколько хорошо соответствует созданное изображение написанному вами запросу.

После окончания установки появится следующее окно:

Но не торопитесь нажимать кнопку «Finish»/«Закончить».

Обязательно поставьте галочку напротив «Create Desktop Shortcut» («Создать ярлык на рабочем столе») и уберите галочку с «Run Easy Diffusion 3.0» («Запустить Easy Diffusion 3.0»).

И только теперь нажмите кнопку «Finish» («Закончить»).

После выполнения всех действий программа будет полностью установлена на ваш компьютер.

Почему мы не стали запускать программу сразу после установки?

Все это необходимо, потому что перед началом работы с системой генеративного искусственного интеллекта Easy Diffusion нам необходимо скачать и установить еще несколько дополнительных файлов-моделей, которые позволят нам создавать невероятно красивые изображения.

Что такое модель?

Модель – это файл, содержащий внутри себя набор параметров обученной нейросети. Размер файла может быть небольшим, а может быть размером в несколько Гбайт. Это зависит от того, для чего создана и используется конкретная модель.

Каждая модель обучена на большом количестве тематических изображений. Набор изображений или данных называется «датасет» (от англ. Dataset).

Существует большое количество различных моделей для создания фотореалистичных изображений в различных художественных стилях. Одни модели лучше работают для создания аниме изображений, другие – для подражания знаменитым художникам.

Чтобы продолжить работу, нам необходимо перейти по следующим ссылкам и скачать последние версии файлов-моделей, с которыми мы будем работать:

– Realistic Vision версия 5.1

(https://civitai.com/models/4201/realistic-vision-v51 );

– DreamShaper версия 8.0

(https://civitai.com/models/4384/dreamshaper );

– Color Fusion версия 1.0

(https://civitai.com/models/20617/color-fusion );

– Midjourney версия 4.0

(https://huggingface.co/prompthero/openjourney/blob/main/mdjrny-v4.ckpt );

– Openjourney версия 4.0 (модель обучена на рисунках Midjourney)

(https://civitai.com/models/86?modelVersionId=27392 );

– SDXL Yamer’s Realism! 2.0

(https://civitai.com/models/136669/sdxl-yamers-realism-realisticanime3d ).

Например, нам нужно скачать файл модели Realistic Vision версия 5.1.

Переходим по ссылке, указанной выше, на страницу, где есть файл модели:

https://civitai.com/models/4201/realistic-vision-v51

Затем находим файл последней версии модели для скачивания:

И скачиваем файл, нажав кнопку «Download» («Скачать»):

На компьютер будет скачан файл realisticVisionV51_v51VAE.safetensors размером 1,9 Гбайт.

В том случае, если у вас не электронная версия книги, вы можете ввести наименования файлов моделей в любой поисковой системе и найти их в сети Интернет. Например, по запросу «download model Realistic Vision» («скачать модель Realistic Vision») вам будет предложен список сайтов для скачивания и в том числе сайт civitai.com, с которого я скачал большинство необходимых мне файлов.

После того, как вы скачаете все или большинство из предложенных вам для скачивания моделей, все файлы вам необходимо перенести (командами «вырезать» и «ставить») в папку по одному из путей: «С:\EasyDiffusion\models\Stable-diffusion» или «D:\EasyDiffusion\models\Stable-diffusion», в зависимости от того, куда вы установили свою программу.

Для этого:

·        Откройте папку на диске, в которую установлена программа Easy Diffusion (например, «С:\EasyDiffusion\» или «D:\EasyDiffusion\»).

·        Затем найдите и откройте папку «models».

·        В ней вы увидите папку «Stable-diffusion». Откройте ее и перенесите в нее скачанные вами файлы моделей.

Поздравляю вас!

Вы стали счастливым обладателем собственной системы искусственного интеллекта Easy Diffusion, установленной на ваш персональный компьютер и дополненной новыми моделями.

Теперь мы можем приступать к первому запуску.

Шаг 3. Первый запуск Easy Diffusion

Если сразу после установки программы вы выбрали команду «Run Easy Diffusion 3.0», как это показано на рисунке ниже:

Перед вами появится черное окно с бегущими строчками непонятного текста:

Пугаться этого окна не стоит, так как это и есть окно работы самого приложения или, если точнее сказать, его серверная часть. Это окно будет появляться всегда, когда программа начинает свою работу. Закрывать его не нужно до того момента, когда вы не решите закончить свою работу. Просто сверните его.

Вам необходимо подождать минуту или две (в зависимости от производительности (мощности) вашего компьютера), после чего откроется еще одно окно в Интернет-браузере (установленного по умолчанию). Это как раз и будет тот самый пользовательский интерфейс Easy Diffusion (или его еще можно назвать клиентское приложение программы), с которым мы с вами будем работать на протяжении всего времени.

Интерфейс Easy Diffusion несколько темноват, но это поправимо. В следующей главе мы узнаем, как сделать нашу работу более комфортной с помощью настроек программы.

Таким образом, при первом запуске программы у нас открылись два окна: окно серверной части программы и окно интерфейса.

Но не торопитесь приступать к работе.

Я бы вам порекомендовал закрыть оба окна и запустить программу заново. Связано это прежде всего с тем, что при повторном запуске программа Easy Diffusion автоматически проверит обновления, загрузит и установит все необходимые новые файлы самостоятельно.

Подождите еще некоторое время, и установленный по умолчанию Интернет-браузер откроется снова.

После чего мы можем приступить с вами к следующему шагу работы – настройке комфортной и стабильной работы Easy Diffusion.

Шаг 4. Настройка Easy Diffusion

Настройка Easy Diffusion, на самом деле, очень проста.

По умолчанию в программе установлены опции, обеспечивающие высокий уровень комфортной работы, и не требуют никаких изменений. Тем не менее есть несколько из них, которые требуют нашего внимания.

Для удобства вашего восприятия я сразу сделал белый интерфейс работы, а также перевел окна приложения с английского языка на русский.

Ниже на рисунке представлен пользовательский интерфейс программы на английском языке:

Пользовательский интерфейс программы на русском языке:

Итак, приступаем.

У Easy Diffusion есть всего пять основных закладок рабочих окон приложения, которые размещены одно за другим вверху рабочей области пользовательского интерфейса:

1.     «Generate»/«Создать».

2.     «Settings»/«Настройки».

3.     «Help & Community» / «Помощь и сообщество».

4.     «Models tools» / «Инструменты моделей».

5.     «What’s new» / «Что нового».

Вся наша с вами работа будет происходить в основном окне «Generate»/«Создать», которому мы уделим основное время в следующей главе.

В этой главе вы рассмотрим содержание следующих закладок:

1.     «Settings»/«Настройки».

2.     «Help & Community» / «Помощь и сообщество».

3.     «Models tools» / «Инструменты моделей».

4.     «What’s new» / «Что нового».

«Settings»/«Настройки»

Чтобы приступить к работе, нам понадобится, прежде всего, окно «Settings» («Настройки»). Для вашего удобства я буду показывать вам два окна с интерфейсом на английском и на русском языках:

В окне «Settings»/«Настройки» представлены следующие опции:

1.     «Theme»/«Тема». Позволяет сменить текущую тему оформления на ту, которая нравится вам. Я изменил на светлую «Light».

2.     «Auto-Save Images» / «Автосохранение изображений». Активируем опцию. Она позволяет нам сохранять все наши изображения и описания к ним в указанной нами папке.

3.     «Save Location» / «Расположение сохраненных файлов». Оставляем значение по умолчанию или меняем его на путь, где будут храниться наши файлы. Например, C:\EasyDiffusion\models\Stable Diffusion UI.

4.     «Metadata format» / «Формат метаданных». Меняем на «txt» – текстовый формат данных, в котором будут храниться наши запросы. Их можно будет прочесть с помощью любого текстового редактора.

5.     «Block NSFW images» / «Блокировать изображения NSFW». Активируем опцию. Запрещает работать с фото определенных категорий.

6.     «Enable Sound» / «Включить звук». Активируем опцию. Мы всегда будем получать звуковое оповещение, что наше изображение готово.

7.     «Process newest jobs first» / «Сначала обрабатывать новые задания». Определяет порядок обработки изображений. По умолчанию обрабатываются задания по порядку. Не меняем.

8.     «Extract LoRA tags from the prompt» / «Извлечение тегов LoRA из командной строки». LoRA расшифровывается как Low-rank adaptation и переводится как «Низкоранговая адаптация». LoRA ускоряет процесс обучения моделей. Параметр не меняем.

9.     «Open browser on startup» / «Открывать браузер при запуске». Опция отвечает за запуск Интернет-браузера после старта серверной части. Не меняем.

10. «GPU Memory Usage» / «Использование памяти графического процессора». Указываем «Low». Опция перекладывает всю работу программы с видеокарты на центральный процессор. Если выбрать «High»/«Высокий», программа может работать очень медленно или совсем перестать работать. Нам нужно выбрать «Law»/«Низкий».

11. Если у вас видеокарта не NVIDIA GeForce RTX, то установите «Low».

12. «Use CPU (not GPU)» / «Использовать центральный процессор компьютера (не графический процессор)». Опция перекладывает всю работу программы не на видеокарту, а на центральный процессор. Если выбрать центральный процессор, программа может работать очень-очень медленно. Не меняем.

13. «Auto-Save Settings» / «Автосохранение настроек». Нажимаем кнопку «Configure»/«Конфигурация». Все опции должны быть выбраны:

Для этого меняем «Enter Prompt» / «Ввод описания». И закрываем окно.

14. «Confirm dangerous actions» / «Подтвердить опасные действия». Опция отвечает за безопасность работы приложения и должна быть активной.

15. «Profile Name» / «Имя профиля». Оставляем значение по умолчанию «default».

16. «Beta channel» / «Бета-канал». Опция предоставляет доступ к еще не очень проверенным и нестабильным функциям, которые могут появиться в следующей версии приложения. Не меняем.

17. «Use the new v3 engine (diffusers)» / «Используйте новый движок v3». Очень важная для нас функция, которая в левой панели инструментов увеличивает перечень параметров для настройки создаваемого изображения. Активируем опцию.

После того, как вы внесли изменения, нажимаем кнопку «Save»/«Сохранить», чтобы сохранить все внесенные изменения.

Ниже в окне располагаются еще несколько опций, которые вам менять не нужно:

Три опции, располагающиеся выше, отвечают за сетевые настройки вашего приложения Easy Diffusion. Мы их не изменяем.

Обратите внимание, что под настройками приводится системная информация, которая позволяет нам увидеть данные используемого нами центрального процессора и видеокарты.

Данные моего компьютера такие:

·        Intel64 Family 6 Model 60 Stepping 3, GenuineIntel.

·        NVIDIA GeForce GTX 980 (cuda:0) (3.5Gb free / 4.3 Gb total).

Данные моего ноутбука:

·        Intel64 Family 6 Model 158 Stepping 10, GenuineIntel.

·        GeForce GTX 1650 (cuda:0) (2.2Gb free / 4.3 Gb total).

А еще ниже указывается адрес, по которому мы можем обращаться к нашему серверу. Для того чтобы открыть пользовательский интерфейс Easy Diffusion в Интернет-браузере, пишем: localhost:9000/ или 127.0.0.1:9000/. После чего откроется рабочее окно программы. 

«Help & Community» / «Помощь и сообщество»

За окном «Settings»/«Настройки» идет окно «Help & Community» / «Помощь и сообщество».

В этом окне, перейдя по одной из ссылок, вы можете самостоятельно изучить дополнительную информацию о работе с программой Easy Diffusion, а также узнать об установке дополнительных моделей и модулей (плагинов).

Также вы можете присоединиться к сообществу пользователей системы.

По самой последней ссылке «Source code on GitHub» – скачать исходные коды Easy Diffusion с сайта GitHub.

«Models tools» / «Инструменты моделей»

За окном «Help & Community» / «Помощь и сообщество» идет окно «Models tools» / «Инструменты моделей», в котором есть две закладки:

·        «LoRA Keywords» / «Ключевые слова LoRA».

·        «Merge models» / «Объединить модели».

В окне «LoRA Keywords» / «Ключевые слова LoRA» вы можете создать для себя наборы ключевых слов для ускорения процесса создания изображений. Подробнее на этой опции мы остановимся в процессе работы.

При помощи окна «Merge models» / «Объединить модели» можно объединять между собой различные модели. Например, те, что мы скачивали после установки из сети Интернет.

Если вам нравятся пара каких-то моделей, с которыми вы работаете чаще всего, вы можете объединить их в одну модель и дать ей свое название. Но тут есть одно небольшое ограничение, модели должны быть однотипными.

Из своего опыта скажу, что в объединении моделей особой необходимости нет. Но, если вы будете пользоваться двумя десятками разных моделей, возможно, вам пригодится данная функциональная возможность приложения Easy Diffusion для объединения по нужным тематикам или стилям.

«What’s new» / «Что нового»

За окном «Models tools» / «Инструменты моделей» идет окно «What’s now» / «Что нового». В этом окне представлен список всех обновлений и изменений, которые были сделаны для текущей и предыдущих версий приложения Easy Diffusion.

Для нас, пожалуй, будет полезна информация о том, что наша программа Easy Diffusion 3.0 работает на 40 % быстрее, чем Easy Diffusion v2.5, что серьезно сказывается на скорости создания наших изображений.

Шаг 5. Приступаем к работе

Как мы с вами уже убедились, система искусственного интеллекта Easy Diffusion – это достаточно простая программа как в установке, так и в настройке.

Еще раз обращу ваше внимание на то, что основное назначение Easy Diffusion заключается в создании из текстового описания или из комбинации текста и изображения нового уникального изображения на базе самых популярных на сегодняшний день нейросетевых моделей (которые мы скачали и установили ранее).

Для того чтобы нам создать наше первое изображение, запускаем программу и переходим в ее рабочую область (окно «Generate»/«Создать»):

В окне «Generate»/«Создать» слева вы увидите панель инструментов, которая позволяет ввести текстовое описание и определить все необходимые параметры создаваемого нового изображения:

Для нашего первого изображения мы добавим только описание и выберем модель, на основе которой будет создано это изображение. Никакие параметры мы сейчас изменять не будем.

Обратите также свое внимание, что над панелью инструментов находится еще три дополнительные кнопки, которые позволяют нам добавить описание из текстового или структурированного файла, а также воспользоваться дополнительными модификаторами изображения:

·        «Load from a file» / «Загрузить из файла». Эта кнопка позволяет загрузить текст с описанием созданной ранее картинки из текстового файла или файла формата «JSON». Она очень полезна, когда вы работаете с большим количеством изображений. Ранее в окне «Settings» («Настройки») мы активировали опцию «Auto-Save Images» («Автосохранение изображений») и определили «Metadata format» («Формат метаданных») как текст «txt». Таким образом наша система сохраняет все ваши изображения и описания в текстовом формате автоматически.

·        «Embedding»/«Встраивания». Настраивается через закладку «Models tools» / «Инструменты моделей» рабочего окна приложения.

·        «Image Modifiers» / «Модификаторы изображения». Очень полезная кнопка, особенно на первых порах, когда вы еще не научились составлять сложные описания новых изображений. В модификаторах вы можете выбрать несколько разных фильтров для своих изображений:

Ниже кнопок находятся два окна:

·        «Enter Prompt» / «Вести описание». Это основное окно, которое предназначено для размещения в нем текстового описания (будем называть его кратко «запроса») того изображения, которое мы хотим создать. Мы на протяжении всего знакомства с книгой будем работать именно с ним.

·        Негативный запрос (Negative Prompt). Это дополнительное окно, в котором описывается краткими фразами все то, чего не должно быть отображено на создаваемом рисунке.

Под окнами запросов находится две кнопки, объединённых одним заголовком «Initial Image (img2img)» / «Первоначальное изображение (Картинку в картинку)»:

·        «Browse»/«Просмотреть». Эта кнопка позволяет добавить нам наше изображение, которое система Easy Diffusion использует для того, чтобы создать из него и написанного нами запроса новое сходное по стилю оформления и форме представления изображение.

·        «Draw»/«Нарисовать». Кнопка открывает окно редактирования изображения. В этом окне мы можем отредактировать добавленное нами в качестве исходного изображение. Например, очистить фон изображения.

Ниже располагается очень важная для нас кнопка «Make image» / «Создать изображение», с помощью которой мы будем запускать процесс создания наших новых уникальных изображений.

Под этой кнопкой «Make image» / «Создать изображение» находится достаточно большой перечень параметров изображения, которое мы хотим создать.

Рассмотрим подробнее все функции «Image Settings» / «Настройки изображения»:

·        «Seed»/«Семя». Это начальный номер генератора случайных чисел, который используется для создания уникального изображения. По умолчанию программа сама создает уникальный номер. Если мы знаем Seed и при прочих равных настройках, мы можем создать ту же самую картинку снова. Эту опцию мы не изменяем и оставляем ее так, как есть.

·        «Number of Images» / «Количество изображений». Эта опция определяет число изображений, которое создается после нажатия кнопки «Make image» / «Создать изображение». Мы оставляем значение по умолчанию (равное «1»). Если изменить цифру, то это скажется на общей производительности системы. Эту опцию мы не изменяем и оставляем так, как есть.

·        «Model» / «Модель». В этом окне отображается список моделей, которые мы скачали с вами ранее. Модели используются для создания уникальных изображений. Их работу мы рассмотрим позднее в этой и последующих главах.

·        «Clip Skip» / «Пропустить клип». Эта опция позволяет системе более точно проанализировать и интерпретировать наш запрос. Когда опция отключена, тогда новое создаваемое изображение максимально точно соответствует нашему запросу. Эту опцию мы не изменяем и оставляем ее отключенной.

·        «ControlNet Image» / «Изображение ControlNet». Эта новая и очень интересная опция системы искусственного интеллекта Easy Diffusion версии 3.0. С помощью ControlNet мы с вами сможем не только создавать уникальное изображение, но и можем сделать его похожим на какую-нибудь знаменитость. Подробнее работа ControlNet будет освещена в отдельной главе.

·        «Custom VAE» / «Настраиваемый вариационный автокодировщик» (Variational Autoencoder, VAE). Эта опция позволяет использовать нам специальный автоэнкодер, который помогает ускорить процесс создания и улучшить качество изображения. В руководстве Easy Diffusion предлагается скачать и использовать файл vae-ft-mse-840000-ema-pruned.ckpt. Должен сказать, что он прекрасно работал с Easy Diffusion 2.5, но некорректно работает с нашей версией Easy Diffusion версии 3.0. Эту опцию мы не изменяем и оставляем ее отключенной.

·        «Sampler»/«Сэмплер». Это вспомогательные инструменты для улучшения создаваемого изображения. Интересно то, что одни семплеры подходят для одних типов картинок, другие семплеры подходят для других типов изображений. Установить, какой из них подходит лучше, придется вам самостоятельно в процессе работы.

·        «Image Size» / «Размер изображения». Эта опция позволяет вам задать размер итогового изображения. Я настоятельно рекомендую использовать вам размер 512х512. После того как вы выберете из множества созданных вами изображений понравившееся, вы сможете командой «Upscale»/«Масштабировать» увеличить картинку до размера 2048х2048 и скачать ее на свой компьютер.

·        «Inference Steps» / «Шаги вывода». Создаваемая нами картинка на первом этапе состоит из так называемого случайного шума. Программа, анализируя наш запрос, шаг за шагом снижает этот шум и выдает нам итоговый вариант изображения. Эта опция определяет число шагов, после выполнения которых мы получаем достаточно детализированное изображение. Вы можете попробовать изменить ее, установив значение в интервале от 25 до 50. Увеличение значения сказывается на производительности работы системы. Оптимальное соотношение скорости и качества Easy Diffusion достигается при значении 25.

·        «Guidance Scale» / «Уточняющая шкала». Эта опция позволяет нам указать системе Easy Diffusion, чтобы она более внимательно анализировала наш запрос с тем, чтобы финальный вариант создаваемого изображения более точно соответствовал его описанию. Оптимальное значение равно 7,5. Чем выше значение, тем меньше возможностей для творчества у Easy Diffusion.

·        «LoRA» (Low-rank adaptation) / «Низкоранговая адаптация». Модели LoRA используются для точной настройки и ускорения работы больших моделей, которые мы ранее скачали и установили и будем использовать для создания наших изображений. Существуют различные LoRA-модели, которые подходят для улучшения какой-то части изображения (например, глаз) или стиля (например, аниме). По умолчанию в системе они не установлены. Скачать их можно с сайта civitai.com, набрав в его поисковой строке «LoRA». Эту опцию мы не изменяем и оставляем ее отключенной (пустой). Тем не менее я рекомендую вам после обучения перейти на сайт civitai.com и скачать подходящие вам модели для дальнейших экспериментов.

·        «Seamless Tiling» / «Бесшовная черепица». Эта опция позволяет сделать из одного вашего изображения двойное незаметно склеенное изображение, то есть сделать панорамное изображение. Эту опцию мы не изменяем и оставляем ее отключенной (пустой).

·        «Output Format» / «Выходной формат». Эта опция задает итоговый формат изображения. Можно выбрать три: jpeg, png и webp. Рекомендую оставить jpeg.

·        «Image Quality» / «Качество изображения». По умолчанию установлено значение 75. Если вам хочется получить более качественное изображение, но ждать его создания немного дольше, установите значение равным 95.

Функции «Render Settings» / «Настройки рендеринга» мы рассмотрим далее в процессе выполнения упражнения. Сейчас оставляем их без изменений.

Итак. Приступим к созданию нашего первого изображения.

Для того чтобы создать наше первое изображение из текста, в окне «Enter Prompt» / «Вести описание» нам необходимо написать наш первый текстовый запрос («Prompt»).

Давайте выполним следующие действия:

·        В окне «Enter Prompt» / «Ввести запрос» напишем следующий запрос на английском языке: «Artificial intelligence that will change the world, beautiful cyborg face» («Искусственный интеллект, который изменит мир, красивое лицо киборга»). Обратите внимание, что система Easy Diffusion понимает запросы только на английском языке. Если вы не очень сильны в нем, воспользуйтесь, пожалуйста, любым доступным вам онлайн-переводчиком.

·        В разделе «Image Settings» («Настройки изображения») выберем алгоритм «sdxlYamersRealism_version2».

Все остальные параметры оставляем без изменений и жмем кнопку «Make image» / «Создать изображение».

Если вы откроете окно серверной части приложения, то вы увидите, как работает система Easy Diffusion:

Возможно, для создания нашей картинки программе Easy Diffusion понадобится скачать дополнительные файлы. После чего через несколько минут она приступит к созданию нового изображения на основе нашего запроса.

Переключаемся в окно графического интерфейса Easy Diffusion.

Ура!

Вы создали свое первое уникальное изображение при помощи системы искусственного интеллекта. Оно находится справа от панели инструментов в рабочей области пользовательского интерфейса:

Тут необходимо сделать небольшое отступление.

Если у вас не получилась такая же картинка, как у меня, не пугайтесь и пробуйте создать ее снова (у меня тоже не с первого раза вышло). Очень часто в Easy Diffusion нужное изображение может получиться со второго, третьего или пятого раза. Это особенность работы программы. Часто такое бывает еще и с простыми запросами, как у нас в примере. Сложный запрос мы рассмотрим в следующей главе.

Следующим нашим шагом будет изучение вариантов улучшения и работы с изображением, которые чаще всего необходимо выполнить после того, как мы создадим любое изображение. Для этого наведите курсор мышки на новое изображение, и вы увидите следующие команды:

·        «Upscale» / «Масштабировать». Если новое изображение вам нравится и вы считаете, что нет необходимости его улучшать далее, выполните команду «Upscale». После чего изображение будет увеличено до максимального разрешения 2040х2048 и вы его сможете сохранить на компьютере.

·        «Fix faces» / «Исправить лица». Команда исправляет лица на изображениях. Чаще всего на изображениях страдают пальцы и детали лиц.

·        «Draw another 25 steps» / «Нарисовать еще 25 шагов». Если вы считаете, что изображение нужно улучшить, выполните команду «Draw another 25 steps». Часто бывает так, что деталей картинки станет больше и ее качество станет лучше. Бывает и так, что особых изменений незаметно. Тут требуется терпение и упорство.

·        «Make Similar Images» / «Сделать несколько похожих изображений». Этой командой мы говорим системе сделать еще пять похожих вариантов изображений и первого полученного варианта.

·        «Download Image» / «Скачать изображение». Команда сохраняет ваше изображение в нужном вам месте.

·        «JSON». Команда сохраняет описание и все параметры созданного вами изображения в размеченном файле. Его можно загрузить в следующий раз, когда вы захотите создать подобное изображение, нажав кнопку «Load from a file» / «Загрузить из файла».

·        «Use as Input» / «Использовать как входные данные». Это очень полезная команда, которая позволяет улучшать изображение из раза в раз. При ее использовании система искусственного интеллекта берет за основу не только наш запрос, но и ваше изображение, на основе чего создается новое изображение. Подробнее работу этой команды мы рассмотрим в следующей главе.

Теперь давайте сделаем еще 25 шагов для улучшения нашего изображения, выполнив команду «Draw another 25 steps» («Нарисовать еще 25 шагов»):

В результате мы получим похожее изображение, но с некоторыми изменениями:

Теперь вернемся к нашему первому изображению «искусственного интеллекта», которое находится ниже.

Наведем курсор мышки на картинку и выбираем команду «Make Similar Image» («Сделать похожее изображение»). Эта команда позволит нам создать из исходного варианта еще пять новых вариантов изображений.

Пять новых вариантов будут размещены в одном окне программы (для наглядности я оставил четыре):

Этой функцией можно пользоваться неограниченное количество раз, до тех пор, пока вы не получите устраивающий вас вариант изображения. Именно так я и делал, когда выбирал картинки для обложки книги.

После того как вы выберете подходящий для вас вариант, все остальные изображения можно удалить. Наведите мышку на то изображение, которое хотите удалить, и нажмите крестик в правом вернем углу:

Таким образом, в окне останутся только те изображения, которые вам нужны для дальнейшей обработки.

Как я раньше отмечал, у всех без исключения моделей, которые мы дополнительно установили в Easy Diffusion, есть один существенный недостаток – они плохо прорисовывают глаза или пальцы рук, а также очень часто на картинках появляются разные странные артефакты. Чтобы откорректировать глаза, на понравившемся нам изображении необходимо снова навести мышку на картинку и выполнить команду «Fix Faces» («Исправить лица»):

В качестве примера я оставлю одно лицо «искусственного интеллекта» и выполню для этого изображения команду «Fix Faces».

Необходимо сделать небольшое замечание и уточнить, что команда «Fix Faces» достаточно часто не улучшает изображение, а порой его портит. Тем не менее всегда стоит попробовать, что может получиться из ваших экспериментов. Будьте смелее и чаще экспериментируйте.

В моем случае лица получились немного смазанными или размытыми:

Ну и, наконец, полученный финальный результат (который нам больше всего нравится) нужно перевести в более высокое разрешение и сохранить его на нашем жестком диске для того, чтобы потом использовать его для дальнейшей работы. Для этого выполняем команду «Upscale» («Масштабировать»), наведя курсор мышки на рисунок.

После этого выполняем команду «Download Image» («Скачать изображение»). Скаченное изображение будет в разрешении 2040х2048 пикселей на дюйм. Этого вполне достаточно, чтобы оформить обложку книги или сделать красивую открытку. 

Поздравляю вас!

Вы только что создали свое первое уникальное изображение при помощи системы искусственного интеллекта Easy Diffusion, которое можно смело назвать маленьким произведением цифрового искусства.

В последующих главах книги мы узнаем много нового об искусственном интеллекте и повысим наш уровень знаний при работе с программой Easy Diffusion.

Шаг 6. Создаем красивое изображение

В этой главе мы с вами рассмотрим самый интересный вариант работы с системой Easy Diffusion – это создание нового изображения из сочетания текста (нашего описания на английском языке) и другого изображения. Также мы уделим особое внимание написанию более сложного запроса.

Обратите внимание на то, что в окне «Enter Prompt» мы пишем не литературное описание той картинки, которую хотим получить, а именно запрос:

Искусственный интеллект, с которым мы работаем, к сожалению, еще не читает наши мысли, и для него важно, чтобы мы говорили с ним на понятном ему языке. Уже можно считать большим достижением разработчиков только то, что запрос пишется набором из ключевых фраз (состоящих из простых для понимания и человека, и машины слов), разделенных запятой и исключительно на английском языке.

Итак, начнем.

Давайте рассмотрим конкретный пример.

Мы создадим с вами за несколько шагов изображение красивого киборга на основе описания из предыдущей главы.

Для этого выполним следующие действия:

·        В окне «Enter Prompt» / «Вести описание» напишем следующую фразу на английском языке: «Artificial intelligence that will change the world, beautiful cyborg face» («Искусственный интеллект, который изменит мир, красивое лицо киборга»). Если у вас возникли сложности с переводом, то рекомендую пользоваться помощью онлайн-переводчиков.

·        «Model»/«Модель»: «sdxlYamersRealism_version2».

·        «Sampler»/«Сэмплер»: «Euler Ancestral».

Все остальные параметры оставляем без изменений и жмем кнопку «Make image» / «Создать изображение».

Давайте в окне «Enter Prompt» / «Вести описание» добавим небольшое уточнение про цвет глаз нашего киборга: «Artificial intelligence that will change the world, beautiful cyborg face, green eyes», а также дадим команду Easy Diffusion использовать наше первое изображение в качестве исходного (родительского) для создания нового (дочернего): «Use as Input» / «Использовать как входные данные».

Все остальные параметры оставляем без изменений и жмем кнопку «Make image» / «Создать изображение».

В результате мы получим изображение, похожее на предыдущее, но уже цвет глаз киборга будет зеленым:

Обратите, пожалуйста, свое внимание на то, что Easy Diffusion обрабатывает ваш запрос слева направо по порядку следования фраз, разделенных запятой.

Основная магия искусственного интеллекта заключается в том, что даже если вы все сделали так же, как я, то в большинстве случаев вы получите либо совсем другую картинку, либо очень похожую, даже при условии, что вы нажмете на кнопку «Make image» / «Создать изображение» много раз.

Связано это с тем, что система Easy Diffusion каждый раз будет интерпретировать фразу «Artificial intelligence that will change the world, beautiful cyborg face, green eyes», как ей захочется по причине того, что наша ключевая фраза очень простая и носит общий характер, а также требует дополнительных уточнений.

Сделаем еще один шаг.

В окне «Enter Prompt» / «Вести описание» добавим еще одно небольшое уточнение про цвет волос нашего киборга: «Artificial intelligence that will change the world, beautiful cyborg face, green eyes, blue hair», а также дадим команду Easy Diffusion использовать наше второе изображение в качестве исходного (родительского) для создания нового (дочернего): «Use as Input» / «Использовать как входные данные».

Все остальные параметры оставляем без изменений и жмем кнопку «Make image» / «Создать изображение».

В результате мы получим изображение, похожее на предыдущее, но уже цвет волос киборга изменится и будет голубым:

В Easy Diffusion есть один интересный способ, который позволяет нам усиливать некоторые фразы в наших запросах с тем, чтобы программа обратила особое внимание на них при создании нового изображения.

Порядок обработки запроса можно определить с помощью круглых «()» и/или квадратных скобок «[]».

Например, предыдущий запрос мы можем написать так: «Artificial intelligence that will change the world, beautiful cyborg face, [green eyes], (blue hair)».

Или, чтобы усилить акцент, пишем так: «Artificial intelligence that will change the world, beautiful cyborg face, [[green eyes]], ((blue hair))», где:

·        (фраза в одних круглых скобках) – увеличивают акцент на фразе на 10 %;

·        ((фраза в двух круглых скобках)) – увеличивают акцент на фразе на 20 %;

·        [фраза в одних квадратных скобках] – уменьшают акцент на фразе на 10 %;

·        [[фраза в двух квадратных скобках]] – уменьшают акцент на фразе на 20 % и т. д.

Практика показала, что использование скобок работает лучше, чем числовые приоритеты. Я рекомендую вам использовать круглые скобки «()» для усиления или квадратные скобки «[]» для ослабления значений фраз в ваших запросах.

Таким образом, всего за четыре шага мы создали киборга с зелеными глазами и синими волосами, очень похожего на простого человека:

Подведем итог.

Алгоритм наших действий был таков:

·        Шаг 1. Создаем первое изображение из текста «Artificial intelligence that will change the world, beautiful cyborg face». После того как первая картинка (а может, вторая или третья, но та, которая очень понравится) будет создана, используем команду «Use as Input» / «Использовать как входные данные», чтобы сказать искусственному интеллекту: «бери ее за основную, потому что она мне очень нравится».

·        Шаг 2. Создаем второе изображение из текста «Artificial intelligence that will change the world, beautiful cyborg face, green eyes». Используем еще раз команду «Use as Input» на второй картинке, чтобы сказать искусственному интеллекту: «бери вторую картинку за основную, потому что она мне очень нравится».

·        Шаг 3. Создаю третье изображение из текста « Artificial intelligence that will change the world, beautiful cyborg face, green eyes, blue hair». Используем еще раз команду «Use as Input» / «Использовать как входные данные» на третьей картинке.

·        Шаг 4. Создаем четвертое изображение из текста «Artificial intelligence that will change the world, beautiful cyborg face, [[green eyes]], ((blue hair))».

Получаем итоговый результат:

Последовательность этих действий дает нам точное представление об основных способах, какими нужно воспользоваться для создания красивого изображения в Easy Diffusion из комбинации текста и изображения.

Чтобы изображение сделать еще более «красивым», пользователи Easy Diffusion часто используют набор следующих ключевых фраз после тех, которые отражают основную суть создаваемого изображения:

·        highly detailed,

·        trending on artstation,

·        soft light,

·        photorealistic,

·        perfect composition,

·        cinematic shot,

·        intricate details,

·        hyper detail,

·        cinematic.

В нашем случае запрос выглядел бы так: «Artificial intelligence that will change the world, beautiful cyborg face, [[green eyes]], ((blue hair)), highly detailed, trending on artstation, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail, cinematic».

К ключевым фразам, отвечающим за «красоту» изображения, можно добавить фамилии известных художников (например, Пикассо) или название сайтов (например, unsplash), на которых хранятся картинки тысяч пользователей. Таким образом, наш обновленный запрос выглядел бы так: «Artificial intelligence that will change the world, beautiful cyborg face, [[green eyes]], ((blue hair)), Picasso, unsplash, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail, cinematic».

Не забывайте и про эмоции. Не будет лишним слово: «smile».

Обновленный запрос: «Artificial intelligence that will change the world, beautiful smiling cyborg face, [[green eyes]], ((blue hair)), highly detailed, trending on artstation, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail, cinematic».

Также не забывайте, что вы можете воспользоваться кнопкой «Image Modifiers» / «Модификаторы изображения», которая находится сверху панели инструментов:

Если вам нравятся эксперименты, то добавьте в список фраз слова: «cyberpunk» или «steampunk», и вы получите нечто невообразимое, как это получилось у меня:

Также нам нельзя забывать о том, что помимо основного запроса, мы можем написать еще «Negative Prompt» / «Отрицательный запрос», который необходим для того, чтобы исключить из создаваемого изображения то, что нам не нужно:

Например, фразы «dark background, black background» исключат из нового изображения темный и черный фон.

Чтобы расширить свои знания в части написания правильных и/или сложных запросов, я рекомендую вам посмотреть альбом изображений, который прилагается к данной книге. Также вы можете найти и изучить дополнительную информацию по написанию запросов в сети Интернет. Например, найти группы с названиями Stable Diffusion или MidJorney в мессенджерах или социальных сетях. В этих группах пользователи публикуют свои запросы, а также изображения, которые им удалось создать при помощи этих запросов. Особое внимание уделяйте синтаксису. В разных системах искусственного интеллекта ключевые фразы разделяются между собой по-разному. В Easy Diffusion фразы пишем через запятую :-)

Шаг 7. Какую модель выбрать?

Какую модель выбрать для создания наиболее реалистичного изображения?

На самом деле, это очень важный и непростой вопрос. Чтобы найти на него ответ, мы с вами должны определить для себя, какую цель мы ставим и какое изображение мы хотим получить в результате нашей работы.

Наша основная цель в книге – это познакомиться с работой программы Easy Diffusion и научиться создавать красивые изображения, посвященные теме искусственного интеллекта, закрепив полученные знания на многочисленных примерах, которые есть в каждой главе этой книги.

Все изображения, которые представлены в этой книге, созданы с использованием Easy Diffusion версии 2.5 и версии 3.0 при помощи следующих моделей:

·        Realistic Vision версия 5.1

(https://civitai.com/models/4201?modelVersionId=114367);

(https://civitai.com/models/4201/realistic-vision-v51 );

·        DreamShaper версия 8.0

(https://civitai.com/models/4384?modelVersionId=109123);

(https://civitai.com/models/4384/dreamshaper );

·        Color Fusion версия 1.0

(https://civitai.com/models/20617/color-fusion );

·        SDXL Yamer’s Realism! 2.0

(https://civitai.com/models/136669/sdxl-yamers-realism-realisticanime3d);

·        Midjourney версия 4.0

(https://huggingface.co/prompthero/openjourney/blob/main/mdjrny-v4.ckpt );

(https://huggingface.co/prompthero/openjourney/blob/main/mdjrny-v4.ckpt );

·        Openjourney версия 4.0 (модель обучена на рисунках Midjourney)

(https://civitai.com/models/86?modelVersionId=27392 );

·        Stable Diffusion версия 1.5

(устанавливается с Easy Diffusion).

Ниже вы можете увидеть сравнение результатов работы четырех разных моделей:

В сети Интернет есть большое количество сайтов (информационных ресурсов), где разработчики выкладывают свои обученные модели. Я предпочитаю использовать сайт civitai.com, на котором есть не только модели, но и различные примеры работ, а также соответствующие им запросы.

Обратите, пожалуйста, свое внимание на то, что в этой книге я делаю акцент именно на тему искусственного интеллекта. Как вы немого позже заметите, в большинстве моих запросов присутствует ключевое слово «cyborg» («киборг»). Это определяется прежде всего моим видением того, что из себя должен представлять искусственный интеллект. Мои взгляды на данную тему сформировались уже очень давно на основе множества фантастических романов и рассказов, которые я успел прочитать за свою жизнь. Эти литературные произведения были написаны такими выдающимися писателями, как: Станислав Лем, Борис и Аркадий Стругацкие, Айзек Азимов, Владимир Васильев, Сергей Лукьяненко, Гарри Гаррисон, Эдмонд Гамильтон, Роберт Шекли, Джордж Лукас, Андре Нортон и многими другими. В большинстве из них робот, интеллектуальная машина и искусственный интеллект – это, по своей сути, некое единое существо из будущего, которое чаще всего представлено в образе человека. Поэтому для меня ни один киборг не может существовать без искусственного интеллекта, который заменяет ему человеческий разум, и именно поэтому на моих изображениях вы увидите много разных футуристических человекоподобных роботов.

Работаем с Easy Diffusion

Я предлагаю вам немного поэкспериментировать и на основе всего одного запроса, но при помощи разных моделей создать свои собственные уникальные изображения.

Чтобы выполнить данное упражнение, вам необходимо скачать с сайта civitai.com следующие модели[1]:

·        DreamShaper версия 8.0

(https://civitai.com/models/4384/dreamshaper );

·        SDXL Yamer’s Realism! версия 2.0

(https://civitai.com/models/136669/sdxl-yamers-realism-realisticanime3d );

·        ProtoVision XL

(https://civitai.com/models/125703/protovision-xl-high-fidelity-3d-photorealism-anime-hyperrealism-no-refiner-needed );

·        Art Universe

(https://civitai.com/models/123313/art-universe );

·        Realistic Vision версия 5.0

(https://civitai.com/models/4201/realistic-vision-v51 ).

Теперь выполним следующие действия:

·        Введем новый запрос («Prompt»): «Nouvelle AI, new artificial intelligence, cyborg face, an enchanted technological portal from the future, journey into the healing power of nature, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail».

·        В качестве модели мы выбираем любую из доступных вам. Я приведу в качестве примера модели, которые наиболее соответствуют теме книги.

·        Остальные параметры Easy Diffusion оставим без изменений.

Обратите, пожалуйста, внимание на то, что если вы используете версию Easy Diffusion 3.0, вы должны использовать последние версии всех моделей для создания изображений, иначе программа Easy Diffusion может выдать ошибку и прекратить работать. Чтобы избежать сбоя в работе Easy Diffusion, перейдите по одной из ссылок и скачайте последнюю версию необходимой вам модели. Например, я столкнулся с тем, что модель Realistic Vision версия 4.0 прекрасно работает в Easy Diffusion версии 2.5, но не работает в Diffusion версии 3.0.

Жмем кнопку «Make image» / «Сделать изображение».

У меня получились следующие результаты для разных моделей, но одного и того же запроса:

Модель DreamShaper версия 7.0

Модель DreamShaper версия 8.0

Скачать модель DreamShaper: https://civitai.com/models/4384/dreamshaper

Модель SDXL Yamer’s Realism! версия 2.0

Скачать модель SDXL Yamer’s Realism! : https://civitai.com/models/136669/sdxl-yamers-realism-realisticanime3d

Модель ProtoVision XL

Скачать модель ProtoVision XL: https://civitai.com/models/125703/protovision-xl-high-fidelity-3d-photorealism-anime-hyperrealism-no-refiner-needed

Модель Art Universe

Скачать модель Art Universe: https://civitai.com/models/123313/art-universe

Модель Realistic Vision версия 5.0

Скачать модель Realistic Vision: https://civitai.com/models/4201/realistic-vision-v51

Еще раз обращу ваше внимание на то, что если у вас установлена Easy Diffusion версии 3.0, вы должны использовать самые последние версии всех моделей.

Для выполнения упражнений, которые представлены во всех последующих главах этой книги, также используйте самые последние версии моделей.

Шаг 8. Удаление или переустановка Easy Diffusion

Удалить программу Easy Diffusion еще проще, чем ее установить.

Тем не менее перед тем как ее удалить, сохраните в любом удобном для вас месте папку «Stable Diffusion UI». В ней хранятся копии всех ваших работ (изображения и фалы с запросами).

Папка находится по одному из следующих путей:

– C:\EasyDiffusion\profile\Stable Diffusion UI,

– D:\EasyDiffusion\profile\Stable Diffusion UI.

Теперь вы можете смело удалить всю папку с программой Easy Diffusion, нажав правой кнопкой мышки на папке и выбрав команду «Удалить».

Если у вас по какой-то причине перестала работать Easy Diffusion, в этом нет ничего страшного. Чтобы решить эту проблему, нужно сделать всего два простых шага:

·        Полностью удалить старую версию программы, сохранив нужные файлы. Перезагрузить компьютер.

·        Установить новую версию Easy Diffusion, скачав предварительно новый дистрибутив программы с сайта: https://github.com/easydiffusion/easydiffusion.

Подробная инструкция представлена во второй главе книги.

Иногда бывает так, что после обновления версии Easy Diffusion с версии 2.5 до версии 3.0 могут перестать создаваться изображения. Это решается путем удаления старых моделей и установки новых. Подробная инструкция представлена также во второй главе книги.

Как мы с вами видим, всего за восемь простых шагов мы научились с вами устанавливать, настраивать и удалять программу, а также создавать красивые изображения.

Далее мы с вами подробнее познакомимся с функциональными возможностями Easy Diffusion и научимся создавать цифровые произведения искусства.

Термин 1. Искусственный интеллект

Знакомство с миром «невероятного искусственного интеллекта» мы начнем с вами, пожалуй, с самого важного – с определения, что же такое «искусственный интеллект».

Само понятие искусственного интеллекта (англ. Artificial Intelligence, AI) появилось уже очень давно. Впервые термин был введен ученым и изобретателем Джоном Маккарти в 1956 году[2],[3].

На сегодняшний день ученые, инженеры, маркетологи, программисты и другие специалисты из разных областей экономики используют совершенно разные определения термина «искусственный интеллект». Это связано, прежде всего, с тем, что искусственный интеллект широко применяется в различных видах человеческой деятельности в различных отраслях экономики. Например, искусственный интеллект используют в образовании, медицине, государственном управлении, финансах, промышленности, автомобилестроении, космонавтике и многих других направлениях. В каждом из этих направлений есть свои уникальные особенности и специализация его применения.

Так что же такое искусственный интеллект?

Искусственный интеллект (ИИ) – это, прежде всего, компьютерная программа, написанная человеком (программистом, инженером, ученым или другим специалистом), которая чаще всего имитирует поведение или умственную деятельность человека или какого-либо другого живого существа, живущего на нашей планете.

Наличие и само существование искусственного интеллекта неразрывно и тесно связано с компьютерами, новыми информационными, вычислительными и сетевыми технологиями.

В том случае, когда для обеспечения работы искусственного интеллекта требуются большие вычислительные мощности современных суперкомпьютеров и набор различных вспомогательных программных продуктов, о нем говорят как о сочетании технических и технологических решений, основная задача которых заключается в обеспечении высокого уровня «интеллекта» такой системы.

На сегодняшний день существует большое количество различных видов искусственного интеллекта. Если все виды рассматривать с точки зрения методов обработки информации, то можно отметить, что наибольшей популярностью у инженеров и программистов пользуется метод, который называется машинным обучением (Machine Learning).

В 1959 году Артуром Ли Сэмюэлем, которого называют «пионером искусственного интеллекта», было дано следующее определение: «Машинное обучение – это область исследования, которая дает компьютерам возможность учиться без явного программирования» [4], [5], [6].

На рисунке, представленном ниже, показано машинное обучение, которое является составной частью искусственного интеллекта:

Соответственно, искусственный интеллект обучают на различных видах данных, применяя метод машинного обучения и очень часто его разновидность – метод глубокого машинного обучения. Данные, на которых обучается искусственный интеллект, называют большими данными (Big Data). Чем больше объем информации и ее разнообразие, тем проще искусственному интеллекту найти закономерности и тем точнее будет получаемый результат.

Раз уж мы обратили свое внимание на машинное обучение, нельзя не упомянуть и про большое разнообразие типов алгоритмов машинного обучения, которые перечислены на рисунке ниже:

Алгоритмов машинного обучения великое множество, и им можно посвятить отдельную книгу. Если вы в дальнейшем решите продолжить свое знакомство с миром невероятного искусственного интеллекта и его технологиями, настоятельно рекомендую вам (в старших классах или в институте) разобраться в принципах работы алгоритмов машинного обучения. Это позволит вам понять, как «думает» искусственный интеллект, позволит сформулировать для себя принципы объяснимости и доверия к результатам его работы.

Большие данные (Big Data) – это термин для наборов цифровых данных. Большой размер данных и их сложность требуют значительных вычислительных мощностей компьютеров и специальных программных инструментов для их анализа и представления. К большим данным относят массивы числовых данных, изображения, аудио- и видеофайлы[7].

Ученые и инженеры, совершенствуя различные вычислительные и информационные технологии, стремятся создать самообучаемые и автономные системы искусственного интеллекта, которые должны по своим возможностям приблизиться к интеллектуальным и функциональным возможностям человека.

Все системы искусственного интеллекта по степени автономности можно разделить на две большие группы:

1.     Системы подчиненного искусственного интеллекта – системы, с помощью которых автоматизируются некоторые интеллектуальные функции и решаются специальные интеллектуальные задачи, ранее решавшиеся только человеком. Такие системы подчинены человеку и его целевым функциям и не противоречат ему. В нашем случае Easy Diffusion является системой подчиненного искусственного интеллекта.

2.     Системы автономного искусственного интеллекта, которые самостоятельно моделируют работу человеческого мозга (память, мышление, творчество, эмоции, воля, свобода выбора, поиск новых знаний и т. д.) и осуществляют самостоятельное принятие оптимальных решений[8]. В идеальном варианте исполнения такие системы должны быть этичными и соблюдать четыре базовых закона робототехники.

Сделаю небольшое отступление и напомню вам, что первые три закона робототехники были сформулированы Айзеком Азимовым в рассказе «Хоровод» в 1942 году, а нулевой закон робототехники – в романе «Роботы и Империя» в 1986 году:

Нулевой.

Робот не может нанести вред человечеству или своим бездействием допустить, чтобы человечеству был нанесён вред.

A robot may not harm humanity, or, by inaction, allow humanity to come to harm.

Первый.

Робот не может причинить вред человеку или своим бездействием допустить, чтобы человеку был причинён вред.

A robot may not injure a human being or, through inaction, allow a human being to come to harm.

Второй.

Робот должен повиноваться всем приказам, которые даёт человек, кроме тех случаев, когда эти приказы противоречат Первому Закону.

A robot must obey orders given it by human beings except where such orders would conflict with the First Law.

Третий.

Робот должен заботиться о своей безопасности в той мере, в которой это не противоречит Первому или Второму Законам.

A robot must protect its own existence as long as such protection does not conflict with the First or Second Law.

Продолжим…

С точки зрения ученых, искусственный интеллект – это компьютерная система, основанная на комплексе научных и инженерных знаний, а также технологий создания интеллектуальных машин, программ, сервисов и приложений, имитирующая мыслительные процессы человека или живых существ, способная с определенной степенью автономности воспринимать информацию, обучаться и принимать решения на основе анализа больших массивов данных[9],[10].

С точки зрения инженеров-программистов, искусственный интеллект – это область информатики, объединяющая вычислительные технологии с надежными наборами данных, в рамках которой разрабатываются компьютерные программы для выполнения задач, способных имитировать человеческий интеллект – обнаруживать смысл, обобщать и делать выводы, выявлять взаимосвязи и обучаться с учетом накопленного опыта[11], [12], [13].

Технологии искусственного интеллекта – это технологии, основанные на использовании искусственного интеллекта, включая компьютерное зрение, обработку естественного языка, распознавание и синтез речи, интеллектуальную поддержку принятия решений и перспективные методы искусственного интеллекта[14].

Визуально технологии, которые применяются для создания различных систем искусственного интеллекта, можно представить так:

Как мы видим, определение термина «искусственный интеллект» неразрывно связано с определением термина «система искусственного интеллекта».

Система искусственного интеллекта – это компьютерная программа, которая представляет собой реализацию новых технологий обработки информации с целью поиска, анализа и синтеза данных из окружающего нас мира для получения о нем новых знаний и решения на их основе различных жизненно важных задач. Система искусственного интеллекта включает в себя модели и алгоритмы, обеспечивающие ее способность обучения и представления (визуализации) новых данных в виде текста, чисел, аудио, видео или изображений[15].

Нужно отметить, что классификаций систем искусственного интеллекта достаточно много. Чаще всего используют следующую классификацию:

Таким образом, можно сказать, что сегодня искусственный интеллект объединяет в себе сочетание машинного обучения (глубокое обучение и обучение с подкреплением), машинного мышления (планирование, составление графиков, представление знаний, поиск и оптимизацию), вычислительные технологии, технологии работы с большими данными, суперкомпьютеры, а также робототехнику (контроль, восприятие, датчики, исполнительные механизмы и интеграцию их всех в киберфизические системы)[16].

В этой книге мы познакомимся с вами с различными определениями искусственного интеллекта, а также вы сможете увидеть своими глазами визуализацию, созданную на основе этих определений в системе искусственного интеллекта Easy Diffusion. 

Работаем с Easy Diffusion

После прочтения этой главы и обладая базовыми навыками работы с Easy Diffusion, давайте попробуем создать новое изображение на основе тех знаний об искусственном интеллекте, которые вы получили из этой главы.

Для закрепления наших навыков работы с Easy Diffusion выполним простое упражнение и постараемся создать образ искусственного интеллекта.

Для этого выполним следующие действия:

·        Составьте собственные запросы на основании приведенных выше определений искусственного интеллекта.

Например, мы написали такие:

a.      «A boy hugs an artificial intelligence robot against the background of a light sky, the camera colorfully focuses on them».

b.     «Machine learning, intelligence, mind, perfect composition, cinematic lighting, crouching near the camera».

c.      «Machine learning, intelligence, mind, cinematic lighting, robot, cyborg».

·        В качестве моделей мы выбрали три модели: «SDXL Yamer’s Realism!», «Realistic Vision» и «DreamShaper».

Жмем кнопку «Make image» / «Сделать изображение».

У нас получились следующие результаты:

Инструмент: Easy Diffusion

Запрос (Prompt): Artificial intelligence that will change the world, white picture

Модель (нейросетевая модель): SDXL Yamer’s Realism!

Автор: Александр Чесалов

Инструмент: Easy Diffusion

Запрос (Prompt): Machine learning, intelligence, mind, perfect composition, cinematic lighting, crouching near the camera

Модель (Model): DreamShaper

Автор: Диана Чесалова

Инструмент: Easy Diffusion

Запрос (Prompt): Machine learning, intelligence, mind, cinematic lighting, robot, cyborg

Модель (Model): Realistic Vision

Автор: Всеволод Чесалов

Термин 2. Узкий искусственный интеллект

Большинство систем искусственного интеллекта, которые люди используют на сегодняшний день, являются разновидностями систем «узкого» (можно даже сказать, «узконаправленного» или «узкоспециализированного») искусственного интеллекта.

Узкий искусственный интеллект (Artificial Narrow Intelligence, ANI) – это искусственный интеллект, обученный и умеющий выполнять эффективно только определенные узкоспециализированные задачи. Слабый искусственный интеллект является самым распространенным вариантом применения современных технологий искусственного интеллекта, к которым, прежде всего, относят так называемое «машинное обучение» и «глубокое машинное обучение» (о которых мы говорили в предыдущей главе)[17].

Современные системы узкого искусственного интеллекта запрограммированы на выполнение одной простой или комплексной задачи за один раз, извлекая информацию из определенного набора данных. Вся их работа чаще всего сводится к постоянному выполнению однотипных задач с целью получения наилучшего результата в узкой области деятельности[18], [19].

К слабому искусственному интеллекту относят: системы распознавания изображений и лиц, чат-боты, разговорных помощников, беспилотные автомобили, рекомендательные и аналитические информационные системы и так далее.

Всем нам знакомые Яндекс Алиса, Apple Siri, Amazon Alexa или суперкомпьютер IBM Watson относятся также, как это ни странно, к узкому или слабому искусственному интеллекту.

Все версии программы ChatGPT, созданной компанией OpenAI, который способен писать не только посты в Интернете, но и создавать собственные литературные произведения, также относится к узкому искусственному интеллекту.

Программа Easy Diffusion, которую мы изучаем в этой книге, является системой слабого и узкоспециализированного искусственного интеллекта. Перед этой системой мы ставим задачу создать для нас новое уникальное изображение из нашего описания или из другого изображения, и Easy Diffusion решает эту задачу очень хорошо.

Так почему же все-таки искусственный интеллект называют слабым?

Слабый искусственный интеллект, каким бы он ни казался «умным» или «сильным», на сегодняшний день не может сравниться с возможностями и потенциалом человеческого интеллекта. Он не обладает волей и не способен на творчество. Слабый искусственный интеллект не способен функционировать самостоятельно, не способен к самообслуживанию, саморазвитию, самосовершенствованию, размножению и к взаимодействию с другими системами искусственного интеллекта, как это делают люди.

Несмотря на все это, у такого вида искусственного интеллекта есть много неоспоримых преимуществ, которые заключается в том, что он способен выполнять конкретные узкоспециализированные задачи очень быстро, качественно и точно, порой даже лучше, чем сам человек. Там, где человек может сильно устать, искусственный интеллект может помочь ему выполнить работу самостоятельно, и делать это искусственный интеллект может в течение долгого времени. Совместная работа человека и искусственного интеллекта очень сильно сказывается на производительности и эффективности выполняемой работы. Описанный процесс очень часто называют «автоматизацией рутинных задач», который значительно облегчает нашу с вами повседневную жизнь.

Использование слабого искусственного интеллекта дает нам больше времени на саморазвитие, отдых и на достижение новых целей.

Работаем с Easy Diffusion

Для закрепления наших навыков работы выполним простое упражнение и постараемся создать образ узкоспециализированного или слабого искусственного интеллекта.

Для этого выполним следующие действия:

·        Составьте собственные запросы на основании приведенного выше определения. Например, мы написали такие:

a.      «Artificial Narrow Intelligence, stupid, dumb robot trying to solve puzzle, cyberpunk».

b.     «Artificial Narrow Intelligence, a large iron computer carries a cup of tea to a man, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail».

·        В качестве модели мы выбрали DreamShaper.

·        Установим параметр «Image Quality» (Качество рисунка) равным 75.

Жмем кнопку «Make image» / «Сделать изображение».

У нас получились следующие результаты:

Инструмент: Easy Diffusion

Запрос (Prompt): Artificial Narrow Intelligence, stupid, dumb robot trying to solve puzzle, cyberpunk

Модель (Model): DreamShaper

Автор: Диана Чесалова

Инструмент: Easy Diffusion

Запрос (Prompt): Artificial Narrow Intelligence, a large iron computer carries a cup of tea to a man, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail

Отрицательный запрос (Negative Prompt): black background

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 50

Качество изображения (Image Quality): 75

Автор: Александр Чесалов

Мы хотели получить ответ от Easy Diffusion на вопрос, каким он представляет себе слабый или узкий искусственный интеллект. Получились довольно забавные картинки.

Попробуйте сами создать свое изображение, используя в качестве ключевой фразы: «Artificial Narrow Intelligence».

Термин 3. Новый искусственный интеллект

Новый искусственный интеллект (Nouvelle AI) – это подход к искусственному интеллекту, впервые был предложен в 1980-х Родни Бруксом, который в то время работал в лаборатории искусственного интеллекта Массачусетского технологического института. Новый ИИ отличается от классического ИИ тем, что его целью является создание роботов с уровнем интеллекта насекомого. Некоторые ученые полагают, что интеллект может самостоятельно возникать у живых существ из простого взаимодействия между собой и другими существами в реальном мире[20].

 

Работаем с Easy Diffusion

Давайте попробуем создать образ искусственного интеллекта с уровнем интеллекта насекомого.

Для этого выполним следующие действия:

·        Составим более сложный запрос на основании приведенного выше определения: «steampunk, cyborg worm, journey into the healing power of nature, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail». Фраза буквально переводится как: «стимпанк, киборг-червь, путешествие в целительную силу природы, фотореалистичность, идеальная композиция, кинематографический кадр, сложные детали, гипердетализация».

·        В качестве модели будем использовать «DreamShaper».

·        В поле «Negative Prompt» / «Отрицательный запрос» добавим фразу: «dark background, human face, woman face», которая позволит нам избежать получения темных рисунков и лиц людей.

·        Для получения более качественного рисунка установим параметр «Image Quality» / «Качество рисунка» равным 85.

Жмем кнопку «Make image» / «Сделать изображение» и получаем новый результат:

Обратите внимание на то, что наш искусственный интеллект похож на некую механизированную зверушку – это очень символично. Возможно, в будущем мы с вами увидим некий симбиоз (или, другими словами, сложное сосуществование разных форм жизни вместе) не только человека и машины, но и различных живых существ, растений и машин.

Инструмент: Easy Diffusion

Запрос (Prompt): steampunk, cyborg worm, journey into the healing power of nature, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Качество рисунка (Image Quality): 85

Автор: Александр Чесалов

В моем случае полученный результат превзошёл все мои ожидания. Easy Diffusion создал очень необычный образ «Nouvelle AI».

Что вышло у вас?

Термин 4. Дружественный искусственный интеллект

Дружественный искусственный интеллект (Friendly Artificial Intelligence) – это область исследования, целью которой является создание позитивной и дружественной для человека системы, способной значительно улучшить условия его существования и работы. Интеллектуальные способности такой системы должны быть на уровне человека или даже превосходить их[21].

Работаем с Easy Diffusion

Для закрепления наших навыков выполним упражнение и постараемся создать образ дружественного искусственного интеллекта.

Но в этот раз мы обратим внимание на настройки рендеринга изображений, которые находятся внизу панели инструментов: 

Для этого выполним следующие действия:

·        Составим запрос на основании приведенного выше определения: «Friendly artificial intelligence, smiling cyborg face, steampunk, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail». Обратите внимание на то, что для усиления нашего запроса мы используем дополнительные фразы:

a.      «Smiling» для придания позитивных эмоций.

b.     «Steampunk» для стилизации изображения.

c.      «Soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail» для придания изображению более реалистичного вида.

·        В качестве модели будем использовать «DreamShaper».

·        Установим параметр «Image Quality» (Качество рисунка) равным 75.

·        И самое главное, активируем все четыре опции раздела «Render Settings» («Настройки рендеринга»):

a.      «Show a live preview» / «Предварительный просмотр в реальном времени». Эта опция покажет нам, как система создает изображение шаг за шагом:

В использовании опции «Show a live preview» («Предварительный просмотр в реальном времени») нет особой необходимости по причине того, что она только увеличивает время на создание нового изображения.

b.     «Fix incorrect faces and eye» / «Исправьте неправильные лица и глаза». Это весьма полезная опция исправляет во время создания изображения лица и глаза. Значений по умолчанию достаточно, но вы можете смело изменить ее параметры и сравнить результаты рендеринга новых изображений. Если вы не активировали данную опцию и у вас появилась такая проблема с лицом или пальцами рук, исправьте ее командой «Fix Face» или сделайте еще 25 шагов командой «Draw another 25 steps».

c.      «Scale up by» / «Масштабировать». Опция позволяет сразу получить изображение в максимальном для этой системы разрешении. Ее использование целесообразно только тогда, когда вы уверены заранее, что получите хороший вариант нового изображения, или тогда, когда вы используете для работы мощный компьютер. Эта опция также увеличивает время на создание нового изображения. Для масштабирования фотографий лучше выбрать алгоритм: «RealESRGAN_4x», для аниме: «RealESRGAN_4x+Anime_6B».

d.     «Show only the corrected/upscaled image» / «Показывать только исправленное/увеличенное изображение».

Жмем кнопку «Make image» / «Сделать изображение» и получаем следующий результат:

Инструмент: Easy Diffusion

Запрос (Prompt): Friendly artificial intelligence, smiling cyborg face, steampunk, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail

Модель (Model): DreamShaper

Качество рисунка (Image Quality): 95

Шаги вывода (Inference Steps): 25

Автор: Александр Чесалов

Дружественный искусственный интеллект получился довольно позитивным.

Что вышло у вас?

Термин 5. Человеко-ориентированный искусственный интеллект

Человеко-ориентированный искусственный интеллект (Human-centered Artificial Intelligence, HCAI) – это приоритетный принцип проектирования и развития искусственного интеллекта, при котором цели, задачи и ограничения человека, группы людей или всего человечества ставится на первое место с тем, чтобы обеспечивать соблюдение их интересов и прав.

В глобальном смысле человеко-ориентированный искусственный интеллект должен работать на благо всего человечества, отдельного человека, обществ, окружающей среды и экосистем, а также их гармоничное развитие и не допустить причинения им вреда[22].

Для того чтобы создать человеко-ориентированный искусственный интеллект, необходимо использовать междисциплинарный подход исследования проблем взаимодействия человека, компьютера и искусственного интеллекта. Для достижения положительных результатов в этом направлении работ человеко-ориентированный искусственный интеллект должен быть справедливым и беспристрастным, безопасным и этичным[23].

Работаем с Easy Diffusion

Теперь постараемся справиться с более трудной задачей и попробуем создать образ человеко-ориентированного искусственного интеллекта на базе запроса и дополнительного изображения.

Для этого выполним следующие действия:

·        В качестве исходного запроса пишем следующий: «Human-centric artificial intelligence, style of the artist Picasso, full length portrait, highly detailed good face, cinematic lighting». Обратите внимание на то, что для стилизации изображения мы используем дополнительную фразу: «style of the artist Picasso».

·        Необходимо скачать из сети Интернет изображение картины Пабло Пикассо «Плачущая женщина»:

·        Загружаем скаченную картинку, используя опцию «Исходное изображение» (Initial Image (img2img)) на панели инструментов.

·        В качестве модели будем использовать «DreamShaper».

·        Установим параметр «Image Quality» (Качество рисунка) равным 75.

 

Жмем кнопку «Make image» / «Сделать изображение» и получаем следующий результат:

Инструмент: Easy Diffusion

Запрос (Prompt): Human-centric artificial intelligence, style of the artist Picasso, full length portrait, highly detailed good face, cinematic lighting

Модель (нейросетевая модель): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Александр Чесалов

Теперь давайте усложним нашу задачу и сделаем на основе получившейся картинки новую.

Для этого выполним следующие действия:

·        Наводим курсор мыши на наше изображение и выбираем команду «Use as Input» / «Использовать как входные данные».

Жмем кнопку «Enqueue next image» / «Поставить в очередь следующее изображение» и получаем следующий результат:

Как мы с вами видим, получилось довольно необычное изображение человеко-ориентированного искусственного интеллекта на основе не просто художественного произведения искусства, а шедевра знаменитого художника Пабло Пикассо.

В приложении к данной книге вы можете ознакомиться и с другими версиями изображений, созданных на основе картины «Плачущая женщина». Также предлагаю вам провести свои творческие эксперименты с Easy Diffusion, взяв за основу любые другие художественные произведения других гениальных художников.

Инструмент: Easy Diffusion

Запрос (Prompt): Human-centric artificial intelligence, style of the artist Picasso, full length portrait, highly detailed good face, cinematic lighting

Модель (нейросетевая модель): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Александр Чесалов 

Термин 6. Вспомогательный интеллект 

Вспомогательный или дополнительный искусственный интеллект (Auxiliary or Supplementary Artificial Intelligence) – это система искусственного интеллекта, которая помогают человеку принимать решения на основе дополнительной информации, получаемой из анализа взаимодействия человека с окружающим его миром. Вспомогательный или дополнительный искусственный интеллект может являться полезным дополнением к системе человеко-ориентированного искусственного интеллекта. Часто вспомогательным искусственным интеллектом называют систему, которая используется специалистами для помощи при решении специализированных задач. Например, врачи используют искусственный интеллект как вспомогательную систему при диагностике раковых опухолей или врожденных пороков сердца.

В машинном обучении существует схожий термин «вспомогательное обучение». Вспомогательное обучение – это подход, при котором в процессе машинного обучения модель определяет наличие объектов, которые не подпадают ни под одну из изученных ею категорий. Название «Вспомогательное обучение» было выбрано из-за введения вспомогательного класса и используется для изучения неизвестных объектов[24]

Работаем с Easy Diffusion

Давайте попробуем создать образ вспомогательного искусственного интеллекта.

Для этого выполним следующие действия:

·        Составим более сложный запрос на основании приведенного выше определения: «dog cyborg that is carrying a bag, cinematic lighting, highly detailed good face, cinematic lighting, white city background».

·        В качестве модели будем использовать «DreamShaper».

·        Для получения более качественного рисунка установим параметр «Image Quality» / «Качество рисунка» равным 95.

Жмем кнопку «Make image» / «Сделать изображение» и получаем новый результат:

Инструмент: Easy Diffusion

Запрос (Prompt): dog cyborg that is carrying a bag, cinematic lighting, highly detailed good face, cinematic lighting, white city background

Negative Prompt: black background

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Качество изображения (Image Quality): 95

Автор: Александр Чесалов

Отличительной особенностью данного упражнения стал не очень сложный запрос, который не содержал упоминания об искусственном интеллекте как таковом. Тем не менее в описании мы упомянули киборга, что, несомненно, повлияло на содержание изображения.

А что получилось у вас?

Термин 7. Здравомыслящий искусственный интеллект 

Здравомыслящий искусственный интеллект (Artificial Intelligence of the Commonsense knowledge) – это одно из направлений развития искусственного интеллекта, которое занимается моделированием способности человека анализировать различные жизненные ситуации и руководствоваться в своих действиях здравым смыслом[25].

Здравый смысл – это накопленная совокупность общепринятых знаний и взглядов, представлений, форм мышления – о движущих силах природы и общества, взаимоотношениях людей; помимо знаний, включает ценности, убеждения, регуляторы практической деятельности, моральные и правовые нормы, элементы религиозного опыта, художественно-эстетические оценки действительности[26]

Работаем с Easy Diffusion

Давайте попробуем создать образ здравомыслящего искусственного интеллекта.

Для этого выполним следующие действия:

·        Составим запрос на основании приведенного выше определения: «Sane artificial intelligence, robot solving human's problems, cyborg, red light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail».

·        В качестве модели будем использовать «DreamShaper».

·        Для получения более качественного рисунка установим параметр «Image Quality» / «Качество рисунка» равным 75.

Жмем кнопку «Make image» / «Сделать изображение» и получаем новый результат:

Инструмент: Easy Diffusion

Запрос (Prompt): Sane artificial intelligence, robot solving human's problems, cyborg, red light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Диана Чесалова 

Что получилось у вас?

Термин 8. Сильный или общий искусственный интеллект 

Сильный искусственный интеллект (Strong Artificial Intelligence, Strong AI) – это прикладная система искусственного интеллекта, технологии и алгоритмы которой могут выполнять значительное число задач анализа данных, принятия на их основе решений и их реализация, обеспечивающая имитацию интеллектуальных способностей человека и объяснимость предлагаемых человеку вариантов решений, воспроизводя и иногда превышая широкий спектр когнитивных и интеллектуальных способностей человека, включая интерпретацию внешних данных и воздействий и извлечение из них смыслов, использование полученных знаний для обучения, планирования и принятия решений в условиях неопределенности и достижения конкретных целей и задач при помощи гибкой адаптации к изменяющимся условиям и взаимодействию с внешней средой[27].

Другими словами, сильный искусственный интеллект – это интеллект, не отличимый от человеческого, обладающий самосознанием. Он способен видеть, слышать, учиться, решать задачи, планировать и самосовершенствоваться, а самое главное, он имеет воображение и способен к творчеству.

 

Общий искусственный интеллект (Artificial General Intelligence) и искусственный интеллект на уровне человека (Artificial Intelligence at the human level, Human Level Machine Intelligence) – это синонимы сильного искусственного интеллекта. Эти термины обозначают степень развития искусственного интеллекта на уровне человека.

На сегодняшний день сильный или общий искусственный интеллект существует только как теоретическая концепция. Некоторые ученые предполагают, что ее практическая реализация случится не ранее 2045 года. Тем не менее среди большого числа ученых и практиков существует устойчивое мнение, что все даже самые современные и совершенные системы искусственного интеллекта, которые существуют на сегодняшний день, являются «слабым ИИ», а прогнозы о том, что к 2045 году будет создан сильный ИИ, является мифом. Причина такому мнению – это сверхсложность устройства нашего головного мозга с точки зрения создания подобного ему суперкомпьютера, который хоть сколь-нибудь смог приблизиться по своей вычислительной мощности к человеческому мозгу. Возможно, в ближайшем будущем прорыв будет осуществлен в области квантовых компьютеров и вычислений, который позволит приблизиться к созданию сильного искусственного интеллекта. 

Работаем с Easy Diffusion

Для закрепления наших навыков работы выполним простое упражнение и постараемся создать образ сильного искусственного интеллекта.

Для этого выполним следующие действия:

·        Составьте собственные запросы на основании приведенного выше определения. Например, мы написали такие:

a.      «Strong artificial intelligence, an athletic male robot that holds the planet Earth on its shoulders, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail, cyborg».

b.     «Robot, cyborg, highly detailed, strong robot, male, day, smart robot, look at camera, head, perfect composition, in the space, Artificial General Intelligence».

c.      «Artificial General Intelligence, robot lying under the tree, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail, cyborg».

d.     «Development of artificial intelligence at the human level, Artificial General Intelligence, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail».

e.      «Human Level Machine Intelligence, cyborg, robot, highly detailed, highly detailed face, robot face, human, man».

·        В качестве модели используйте «DreamShaper».

·        Установим параметр «Image Quality» (Качество рисунка) равным 75.

Жмем кнопку «Make image» / «Сделать изображение».

У нас получились следующие результаты:

Инструмент: Easy Diffusion

Запрос (Prompt): Strong artificial intelligence, an athletic male robot that holds the planet Earth on its shoulders, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail, cyborg

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Диана Чесалова

Инструмент: Easy Diffusion

Запрос (Prompt): Robot, cyborg, highly detailed, strong robot, male, day, smart robot, look at camera, head, perfect composition, in the space, Artificial General Intelligence

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Всеволод Чесалов

Инструмент: Easy Diffusion

Запрос (Prompt): Artificial General Intelligence, robot lying under the tree, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail, cyborg

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Диана Чесалова

Инструмент: Easy Diffusion

Запрос (Prompt): Strong artificial intelligence, Strong AI, Transhumanism, Bioconservatism, robot of the future, cyborg, highly detailed, highly detailed face, soft light, perfect composition, head, look at camera

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Всеволод Чесалов

Инструмент: Easy Diffusion

Запрос (Prompt): development of artificial intelligence at the human level, Artificial General Intelligence, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Диана Чесалова

Инструмент: Easy Diffusion

Запрос (Prompt): Human Level Machine Intelligence, cyborg, robot, highly detailed, highly detailed face, robot face, human, man

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Всеволод Чесалов

 

Термин 9. Объяснимый искусственный интеллект 

Когда мы с вами говорим об искусственном интеллекте, мы, скорее всего, представляем его себе как некую нематериальную или абстрактную совершенную интеллектуальную систему, которая общается с нами приятным голосом и способна дать нам ответ на любой интересующий нас вопрос.

Тем не менее искусственный интеллект – это вполне конкретная компьютерная программа, создаваемая учеными, инженерами и множеством других специалистов из самых разных отраслей и областей науки и техники.

В тот самый момент, когда мы осознаем тот факт, что мы общаемся с программой, получаем от нее информацию и нам необходимо принять для себя какое-либо важное решение, мы начинаемся задумываться над вопросами, а стоит ли нам безоговорочно доверять информации или совету какой-то «умной» программы и почему именно эта программа нам советует поступить так, а не иначе.

Именно тогда, когда перед нами стоит вопрос «объяснимости», на первый план выходит так называемый «объяснимый искусственный интеллект». 

Объяснимый искусственный интеллект (Explainable Artificial Intelligence, XAI) – набор правил и методов, позволяющих пользователям системы искусственного интеллекта понять, почему алгоритмы машинного обучения этой системы пришли именно к тем или иным результатам работы и/или выводам. Объяснимый искусственный интеллект обеспечивает прозрачность работы используемой системы ИИ для ее пользователей, по своей сути противопоставляя себя принципу «черного ящика» в машинном обучении.

Вопросы объяснимости получаемых результатов работы системы искусственного интеллекта на самом деле интересуют не только нас с вами, как пользователей таких систем, но и инженеров-программистов, их создающих.

Когда разработчики переходят от программирования и экспериментов по решению простейших задач автоматизации к разработке серьезных программных систем, например, систем поддержки принятия решений, они должны не только сами понимать, на основании чего получаются те или иные результаты работы, но и быть готовыми объяснить их происхождение пользователям системы искусственного интеллекта, которую они разрабатывают. Это необходимо делать еще и потому, что каждый разработчик несет персональную ответственность за создаваемые им алгоритмы, модели, программы, системы и другие приложения и сервисы, которые впоследствии будут использованы людьми. Неверно принятое решение на «необъяснимых» результатах работы системы искусственного интеллекта может привести к катастрофическим последствиям как для отдельно взятого человека, так и для отдельно взятой компании, города или даже целой страны.

Очень часто бывает так, что программист, обучающий модель, не является экспертом в той или иной предметной области, и это, на самом деле, большая проблема. Например, программист не является врачом, что, конечно, очевидно. Как вам известно, многие врачи обладают огромным запасом знаний, опыта и интуиции, которые с первого взгляда могут сказать, что нельзя доверять тем или иным данным, полученным от использования какой-то конкретной модели, применяемой в системе поддержки принятия решений. Специалист сразу отметит, что модель делает неразумный прогноз. Несомненно, программисты и врачи должны работать в тесной кооперации, но очень часто бывает так, что программист принимает решение о тех или иных результатах работы самостоятельно, что может повлечь за собой наличие скрытой ошибки при расчетах и точности получаемых данных. Именно в таких случаях при разработке систем искусственного интеллекта инженеры-программисты должны уделять большое внимание вопросам объяснимости.

На рисунке ниже показан современный подход к созданию объяснимого искусственного интеллекта.

Как мы с вами видим, на сегодняшний день необходимо создание дополнительных инструментов понимания и объяснимости работы системы искусственного интеллекта, которые бы были полезными при принятии решений о том, заслуживают полученные с ее помощью данные доверия или нет[28], [29].

Например, инженеры-программисты для объяснения предсказаний базовых моделей машинного обучения и оценки их полезности в различных задачах классификации и регрессии используют библиотеку «Lime». На сегодняшний день библиотека работает с анализом текстовых и табличных классификаторов, а также работает с классификаторами изображений. Lime может объяснить любой классификатор «черного ящика» с двумя или более классами[30].

Необходимость в реализации объяснимого искусственного интеллекта как для разработчика, так и для нас с вами, как пользователей систем искусственного интеллекта, становится не только очевидной, но и вполне важной и ответственной задачей.

Еще одним немаловажным свойством системы искусственного интеллекта, выступающим наравне с «объяснимостью», является ее «прозрачность». В английском языке слово «прозрачность» (англ. «transparency») является синонимом слову «безошибочность» (англ. «unmistakableness»).

Прозрачность работы систем искусственного интеллекта обеспечивается предоставлением полноценной открытой информации для пользователей систем искусственного интеллекта (то есть для нас с вами) о том, какие продукты или услуги предоставляются напрямую или с помощью систем искусственного интеллекта. А также какие управленческие решения принимаются теми или иными физическими лицами, компаниями или организациями на основе данных, полученных и предоставленных системами искусственного интеллекта. Эта информация должна указывать на то, что принимаемые решения не нарушают права человека (пользователей систем искусственного интеллекта) и не подвергают его какой-либо опасности. Высокий уровень прозрачности обеспечит возможность контроля со стороны общества, что, в свою очередь, может способствовать снижению уровня коррупции, дискриминации или рисков возникновения того или иного вида ущерба.

Таким образом, обеспечение объяснимости и прозрачности работы систем искусственного интеллекта является существенным условием не только при их проектировании и разработке, но и при их эксплуатации с целью обеспечения уважения к частной жизни граждан и защиты прав и свобод человека в течение всего жизненного цикла создаваемых систем ИИ[31], [32], [33].

Термины «прозрачность» и «объяснимость» являются неотъемлемыми критериями оценки системы «доверенного искусственного интеллекта», с определением которой мы познакомимся с вами в следующей главе. 

Работаем с Easy Diffusion

Для закрепления наших навыков работы выполним следующее упражнение и постараемся создать образ объяснимого искусственного интеллекта.

Для этого выполним следующие действия:

·        Составьте собственные запросы на основании приведенного выше определения. Например, мы написали такие:

a.      «Explainable artificial intelligence, solving the simplest automation tasks to developing serious software systems, transparency, unmistakableness, robot, cyberpunk ».

b.     «Transparency, cyborg, look at camera, head, invisible».

·        В качестве моделей мы выбрали DreamShaper и Realistic Vision. Обратите внимание на то, что для создания изображений роботов и киборгов лучше всего подходят именно эти модели.

·        Установим параметр «Image Quality» / «Качество рисунка» равным 75.

Жмем кнопку «Make image» / «Сделать изображение».

У нас получились следующие результаты:

Инструмент: Easy Diffusion

Запрос (Prompt): Explainable artificial intelligence, solving the simplest automation tasks to developing serious software systems, transparency, unmistakableness, robot, cyberpunk

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Всеволод Чесалов

Инструмент: Easy Diffusion

Запрос (Prompt): Transparency, cyborg, look at camera, head, invisible

Модель (Model): Realistic Vision

Шаги вывода (Inference Steps): 25

Автор: Всеволод Чесалов 

 

Термин 10. Доверенный или надежный искусственный интеллект 

Доверенный или надежный искусственный интеллект (Trustworthy Artificial Intelligence, TAI) – это прикладная система искусственного интеллекта, обеспечивающая выполнение возложенных на нее задач с учетом ряда дополнительных требований, обеспечивающих доверие к результатам работы системы, включающих в себя:

·        достоверность и интерпретируемость выводов и предлагаемых решений, полученных с помощью системы и проверенных на верифицированных тестовых примерах;

·        безопасность как с точки зрения невозможности причинения вреда пользователям системы на протяжении всего жизненного цикла системы, так и с точки зрения защиты от взлома, несанкционированного доступа и других негативных внешних воздействий;

·        приватность и верифицируемость данных, с которыми работают алгоритмы искусственного интеллекта, включая разграничение доступа и другие связанные с этим вопросы;

·        внедрение этических аспектов применения искусственного интеллекта[34].

 

Надежный искусственный интеллект основан на идее о том, что доверие к его работе создает основу общества, экономики и устойчивого развития. Люди, организации и общества могут реализовать весь потенциал систем искусственного интеллекта только в том случае, если доверие может быть установлено при его разработке, внедрении, поддержки и использовании[35], [36]

Работаем с Easy Diffusion

Для закрепления наших навыков работы выполним простое упражнение и постараемся создать образ доверенного искусственного интеллекта.

Для этого выполним следующие действия:

·        Составьте собственные запросы на основании приведенного выше определения. Например, мы написали такой:

a.      «Trusted Artificial Intelligence System, Responsible Artificial Intelligence, Responsible AI, trusted artificial intelligence, trusted artificial intelligence system, ethical aspects, full length portrait, highly detailed, cinematic lighting, robot face».

·        В качестве модели мы выбрали Realistic Vision.

·        Установим параметр «Image Quality» / «Качество рисунка» равным 75.

Жмем кнопку «Make image» / «Сделать изображение».

У нас получились следующие результаты:

Инструмент: Easy Diffusion

Запрос (Prompt): Trusted Artificial Intelligence System, Responsible Artificial Intelligence, Responsible AI, trusted artificial intelligence, trusted artificial intelligence system, ethical aspects, full length portrait, highly detailed, cinematic lighting, robot face

Модель (Model): Realistic Vision

Шаги вывода (Inference Steps): 25

Автор: Всеволод Чесалов 

 

Термин 11. Этичный искусственный интеллект 

Этичный искусственный интеллект (Ethical Artificial Intelligence) – это система доверенного искусственного интеллекта, придерживающаяся в своей работе строго определенных этических принципов в отношении фундаментальных человеческих ценностных установок, включая такие как: уважение, защита и поощрение прав человека; благополучие окружающей среды и экосистем; обеспечение разнообразия и инклюзивности (процесса включения людей с физической и ментальной инвалидностью в полноценную общественную жизнь); жизнь в мирных, справедливых и взаимосвязанных обществах[37]

Работаем с Easy Diffusion

Для закрепления наших навыков работы выполним простое упражнение и постараемся создать образ этического искусственного интеллекта.

Для этого выполним следующие действия:

·        Составьте собственные запросы на основании приведенного выше определения. Например, мы написали такой:

a.      «Ethical artificial intelligence, robot, white background, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail, cyborg ».

·        В качестве модели мы выбрали DreamShaper.

·        Установим параметр «Image Quality» (Качество рисунка) равным 75.

Жмем кнопку «Make image» / «Сделать изображение».

У нас получился следующий результат:

Инструмент: Easy Diffusion

Запрос (Prompt): Ethical artificial intelligence, robot, white background, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail, cyborg

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Диана Чесалова
 

Термин 12. Потребительский искусственный интеллект 

Потребительский искусственный интеллект (Consumer artificial intelligence) – это специализированные программы и сервисы искусственного интеллекта, которые широко используются в инфраструктуре Интернета вещей и промышленного Интернета вещей. Например, осуществление мониторинга здоровья при помощи носимых устройств, таких как «умные» часы, фитнес-крекеры или браслеты. Еще одним примером служат интеллектуальные бытовые устройства, такие как: «умный» дом, роботы-пылесосы, «умные» динамики или «умные» кофеварки. Все «умные» устройства подключены к сети Интернет, через которую осуществляется их взаимодействие между собой и с другими «умными» устройствами. В свою очередь, человек может общаться с этими устройствами при помощи программ или интеллектуальных голосовых помощников. 

Работаем с Easy Diffusion

Для закрепления наших навыков работы выполним простое упражнение и постараемся создать образ узкоспециализированного или слабого искусственного интеллекта.

Для этого выполним следующие действия:

·        Составьте собственные запросы на основании приведенного выше определения. Например, мы написали такие:

a.      «Consumer artificial intelligence, highly detailed, cyberpunk, cyborg».

b.     «Consumer artificial intelligence, robot that vacuums the white floor, white background, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail».

·        В качестве модели мы выбрали DreamShaper.

·        Установим параметр «Image Quality» (Качество рисунка) равным 75.

Жмем кнопку «Make image» / «Сделать изображение».

У нас получились следующие результаты:

Инструмент: Easy Diffusion

Запрос (Prompt): Consumer artificial intelligence, highly detailed, cyberpunk, cyborg

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Всеволод Чесалов

Инструмент: Easy Diffusion

Запрос (Prompt): Consumer artificial intelligence, robot that vacuums the white floor, white background, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail

Модель (Model): DreamShaper

Автор: Диана Чесалова

 

Термин 13. Генеративный искусственный интеллект 

Генеративный искусственный интеллект (Generative Artificial Intelligence) – это самый перспективный метод глубокого машинного обучения, при котором нейросеть изучает массив больших данных, например, фотографии, видео или текст на определенную тему, после чего, используя полученную информацию, создает свой собственный уникальный контент.

На сегодняшний день, по мнению специалистов, возможности систем генеративного искусственного интеллекта практически не имеют границ. Они способны с большой скоростью создавать новый уникальный контент, идеи, разговоры, истории, сценарии, художественные произведения в стиле знаменитых писателей, произведения изобразительного искусства в стиле знаменитых художников, видео и музыку в стиле знаменитых композиторов разных эпох[38].

Работа генеративного искусственного интеллекта основана на базовых моделях машинного обучения, предварительно обученных на больших данных. Ярким примером базовой модели является модель GPT. Она представляет собой большую языковую модель (или, как еще говорят, семейством моделей нейронных сетей), специально разработанную для решения языковых задач, таких как обобщение, генерация текста в реальном времени, классификация, открытые вопросы и ответы, а также извлечение информации. Появление моделей GPT стало переломным моментом в широком распространении машинного обучения, поскольку теперь эту технологию можно использовать для автоматизации и улучшения широкого спектра задач, начиная с переводов текстов на различные языки и заканчивая написанием постов в блогах, созданием веб-сайтов, визуальных эффектов, анимации, написанием программного кода, анализом данных и созданием интеллектуальных голосовых помощников. Ценность этих моделей заключается в скорости их работы и направлениях, в которых они могут работать[39], [40].

К системам генеративного искусственного интеллекта относят систему ChatGPT (которая создана на модели GPT), а также систему Easy Diffusion (как мы помним, это вариант сборки Stable Diffusion), которую мы изучаем в этой книге.

Возможно, в ближайшем будущем многое из того, что вы будете создавать или использовать в своей учебе и работе, будет создано с помощью различных систем генеративного искусственного интеллекта. 

Работаем с Easy Diffusion

Для закрепления наших навыков работы выполним простое упражнение и постараемся создать образ генеративного искусственного интеллекта.

Для этого выполним следующие действия:

·        Составьте собственные запросы на основании приведенного выше определения. Например, мы написали такие:

a.      «Generative Artificial Intelligence, a robot that is entangled in wires and microcircuits, steampunk, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail».

b.     «Generative Artificial Intelligence, highly detailed, cyberpunk, robot, cyborg, cinematic shot, cinematic lighting, photo realistic, perfect composition».

·        В качестве модели мы выбрали DreamShaper.

·        Установим параметр «Image Quality» (Качество рисунка) равным 75.

Жмем кнопку «Make image» / «Сделать изображение».

У нас получились следующие результаты:

Инструмент: Easy Diffusion

Запрос (Prompt): Generative Artificial Intelligence, a robot that is entangled in wires and microcircuits, steampunk, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail

Модель (Model): DreamShaper

Автор: Диана Чесалова

Инструмент: Easy Diffusion

Запрос (Prompt): Generative Artificial Intelligence, highly detailed, cyberpunk, robot, cyborg, cinematic shot, cinematic lighting, photo realistic, perfect composition

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Всеволод Чесалов

Термин 14. Игровой искусственный интеллект 

Игровой искусственный интеллект (Game artificial intelligence) – это одна из самых распространенных форм искусственного интеллекта, разработанная и использующаяся для компьютерных или приставочных игр. Чаще всего игровой искусственный интеллект заменяет интеллект различных игровых персонажей, включая различную технику (такую как: машины, самолеты, корабли, космические корабли и другую), управляемую людьми, или управляет целыми локациями и мирами, которые меняются в зависимости от действия игрока. 

Работаем с Easy Diffusion

Для закрепления наших навыков работы выполним простое упражнение и постараемся создать образ игрового искусственного интеллекта.

Для этого выполним следующие действия:

·        Составьте собственные запросы на основании приведенного выше определения. Например, мы написали такие:

a.      «Game artificial intelligence, a robot that is stuck in a computer game, steampunk, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail».

b.     «Game artificial intelligence, head, look at camera, highly detailed, cyberpunk, robot, cyborg, cinematic shot, cinematic lighting, photo realistic, perfect composition, robot is staying in the city of the future, playing computer game».

·        В качестве модели мы выбрали DreamShaper.

·        Установим параметр «Image Quality» (Качество рисунка) равным 75.

Жмем кнопку «Make image» / «Сделать изображение».

У нас получились следующие результаты:

Инструмент: Easy Diffusion

Запрос (Prompt): Game artificial intelligence, a robot that is stuck in a computer game, steampunk, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Диана Чесалова

Инструмент: Easy Diffusion

Запрос (Prompt): Game artificial intelligence, head, look at camera, highly detailed, cyberpunk, robot, cyborg, cinematic shot, cinematic lighting, photo realistic, perfect composition, robot is staying in the city of the future, playing computer games

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Всеволод Чесалов

Термин 15. Искусственный интеллект для ИТ-операций 

Искусственный интеллект для ИТ-операций (Artificial Intelligence for IT Operations, AIOps) – это использование машинного обучения и других технологий искусственного интеллекта для автоматизации различных рабочих и технологических ИТ-процессов, которые инженерами-программистами выполняются вручную. AIOps похож на MLOps тем, что использует машинное обучение и другие технологии искусственного интеллекта для автоматизации ИТ-процессов. AIOps отличается от MLOps тем, что автоматизация процессов происходит в отделе ИТ-операций организации, а не в группе машинного обучения и искусственного интеллекта. Также AIOps отличается от MLOps тем, что использует искусственный интеллект для автоматизации группы процессов, а не только одной или двух задач, как это делает MLOps.

Искусственный интеллект для ИТ-операций – это новая ИТ-практика, которая применяет искусственный интеллект к ИТ-операциям, чтобы помочь организациям разумно управлять ИТ-инфраструктурой, сетями и приложениями для обеспечения высокого качества, производительности, отказоустойчивости и безопасности. Термин AIOps появился в 2016 году как отраслевая категория, которая помогает улучшить процессы автоматизации ИТ-операций с помощью технологий искусственного интеллекта [41], [42], [43]

Работаем с Easy Diffusion

Для закрепления наших навыков работы с Easy Diffusion выполним простое упражнение и постараемся создать образ искусственного интеллекта для AIOps.

Для этого выполним следующие действия:

·        Составьте собственные запросы на основании приведенного выше определения. Например, мы написали такие запросы:

a.      «Artificial Intelligence for IT Operations, AIOps, dog training robot, cyborg dog, steampunk, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail».

b.     « Artificial Intelligence for IT Operations, highly detailed, sitting on the sofa, cyborg cat, cyberpunk, perfect composition. cinematic light, photo realistic, robot cat».

·        В качестве моделей мы выбрали «Realistic Vision» и «DreamShaper».

·        Установим параметр «Image Quality» (Качество рисунка) равным 75.

Жмем кнопку «Make image» / «Сделать изображение».

У нас получились следующие результаты:

Инструмент: Easy Diffusion

Запрос (Prompt): Artificial Intelligence for IT Operations, AIOps, dog training robot, cyborg dog, steampunk, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail

Модель (Model): Realistic Vision V4.0

Шаги вывода (Inference Steps): 25

Автор: Диана Чесалова

Инструмент: Easy Diffusion

Описание (Prompt): Artificial Intelligence for IT Operations, highly detailed, sitting on the sofa, cyborg cat, cyberpunk, perfect composition. cinematic light, photo realistic, robot cat

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Всеволод Чесалов

 

Термин 16. Композитный искусственный интеллект 

Композитный искусственный интеллект (Composite Artificial Intelligence, Composite AI) – это комбинированное применение различных методов искусственного интеллекта (глубокое машинное обучение, компьютерное зрение, обработки естественного языка, контекстный анализ, графы знаний, визуализация данных, методы прогнозирования и т. д.) для повышения эффективности обучения моделей с целью достижения синергетического эффекта от их использования и наилучших результатов работы систем искусственного интеллекта.

Одна из идей, которая закладывается при создании композитного искусственного интеллекта, заключается в получении здравомыслящего искусственного интеллекта, который будет способен понимать основную суть проблем и решать широкий спектр задач, предлагая оптимальные решения[44].  

Работаем с Easy Diffusion

Для закрепления наших навыков работы с Easy Diffusion выполним простое упражнение и постараемся создать образ композитного искусственного интеллекта.

Для этого выполним следующие действия:

·        Составьте собственные запросы на основании приведенного выше определения. Например, мы написали такие запросы:

a.      «Cyborg and hamburger, unreal future world font, full length portrait, highly detailed good face, cinematic lighting».

b.     «Composite artificial intelligence, highly detailed, siting in the forest, cyborg hamster, cyberpunk, perfect composition, cinematic light, photo realistic, robot hamster, cyberpunk».

·        В качестве моделей мы выбрали «Realistic Vision» и «DreamShaper».

·        Установим параметр «Image Quality» (Качество рисунка) равным 75.

Жмем кнопку «Make image» / «Сделать изображение».

У нас получились следующие результаты:

Инструмент: Easy Diffusion

Запрос (Prompt): Cyborg and hamburger, unreal future world font, full length portrait, highly detailed good face, cinematic lighting

Модель (нейросетевая модель): Realistic Vision

Автор: Александр Чесалов

Инструмент: Easy Diffusion

Описание (Prompt): Composite artificial intelligence, highly detailed, siting in the forest, cyborg hamster, cyberpunk, perfect composition, cinematic light, photo realistic, robot hamster, cyberpunk

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Всеволод Чесалов

 

Термин 17. Причинно-следственный искусственный интеллект 

Причинно-следственный искусственный интеллект (Causal Artificial Intelligence) – это система искусственного интеллекта, которая позволяет выявлять и объяснять причинно-следственные связи, чтобы выйти за рамки стандартных моделей прогнозирования, тем самым позволив перейти к системам искусственного интеллекта, которые могут более эффективно выполнять прогнозы, действуя более автономно.

Причинно-следственный искусственный интеллект играет очень важную роль для аналитиков и инженеров-программистов в процессе понимания причин, которые приводят к получению тех или иных результатов работы системы искусственного интеллекта. Он может быть частью или подсистемой объяснимого искусственного интеллекта. 

Работаем с Easy Diffusion

Для закрепления наших навыков работы с Easy Diffusion выполним простое упражнение и создадим образ причинно-следственного искусственного интеллекта.

Для этого выполним следующие действия:

·        Составьте собственные запросы на основании приведенного выше определения. Например, мы написали такие запросы:

a.      «Causal Artificial Intelligence, highly detailed, siting in the forest, cyborg monkey, cyberpunk, perfect composition. cinematic light, photo realistic, robot monkey, cyberpunk».

b.     «Robot frog swimming in the swamp, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail, cyborg ».

·        В качестве моделей мы выбрали «Realistic Vision» и «DreamShaper».

·        Установим параметр «Image Quality» (Качество рисунка) равным 75.

Жмем кнопку «Make image» / «Сделать изображение».

У нас получились следующие результаты:

 

Инструмент: Easy Diffusion

Описание (Prompt): Causal Artificial Intelligence, highly detailed, siting in the forest, cyborg monkey, cyberpunk, perfect composition. cinematic light, photo realistic, robot monkey, cyberpunk

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Всеволод Чесалов

Инструмент: Easy Diffusion

Запрос (Prompt): Robot frog swimming in the swamp, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail, cyborg

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Диана Чесалова

 

Термин 18. Распределенный искусственный интеллект

Распределенный искусственный интеллект (Distributed Artificial Intelligence, DAI) – это одна из научных областей исследования, проектирования и создания сложных распределенных систем искусственного интеллекта.

В основе создания распределенного искусственного интеллекта лежат две основные идеи:

·        Первая заключается в использовании концепции коллективного разума или, как его еще называют, роевого интеллекта. Примером организованного коллективного разума могут служить пчелы или муравьи, каждый из которых функционирует автономно, имеет свой разум и принимает самостоятельные решения, при этом все вместе они функционируют как единый живой организм (улей или колония), обладающий собственным коллективным сознанием.

·        Вторая заключается в том, что распределенные системы обладают большей производительностью (вычислительной мощностью), доступностью и масштабируемостью, а соответственно, более эффективны и надежны, по сравнению с централизованными системами, расположенными в конкретном месте и обладающими фиксированной вычислительной мощностью.

Распределенный искусственный интеллект представляет из себя большое число территориально распределенных автономных узлов обработки информации или узлов обучения, которые называются агентами. В отличие от роевого интеллекта пчел или муравьев, которые выполняют самостоятельно одинаковые задачи, агенты могут выполнять совместно множество различных специализированных задач. Система, в которой множество независимых агентов взаимодействуют для решения комплексной задачи, называется мультиагентной. В мультиагентной системе групповой интеллект превышает интеллект каждого агента в отдельности. Таким образом, данный подход к проектированию и построению мультиагентных систем может быть использован в разработке композитного распределенного искусственного интеллекта [45], [46], [47]

Работаем с Easy Diffusion

Для закрепления наших навыков работы с Easy Diffusion выполним простое упражнение и создадим образ распределенного искусственного интеллекта.

Для этого выполним следующие действия:

·        Составьте собственные запросы на основании приведенного выше определения. Например, мы написали такие запросы:

a.      «Robot owl sitting on the branch, forest, cyborg, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail».

b.     «Distributed artificial intelligence, highly detailed, in the sea, cyborg shark, cyberpunk, perfect composition. cinematic light, photo realistic, robot shark, cyberpunk».

·        В качестве моделей мы выбрали «Realistic Vision» и «DreamShaper».

·        Установим параметр «Image Quality» (Качество рисунка) равным 75.

Жмем кнопку «Make image» / «Сделать изображение».

У нас получились следующие результаты:

Инструмент: Easy Diffusion

Запрос (Prompt): Robot owl sitting on the branch, forest, cyborg, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Диана Чесалова

Инструмент: Easy Diffusion

Описание (Prompt): Distributed artificial intelligence, highly detailed, in the sea, cyborg shark, cyberpunk, perfect composition, cinematic light, photo realistic, robot shark, cyberpunk

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Всеволод Чесалов

Обратите свое внимание, пожалуйста, на то, что роевым интеллектом обладают не только пчелы и муравьи, им также обладают стаи птиц и стаи рыб. На самом деле, коллективным интеллектом обладают множество живых организмов на нашей планете.

Кого из них удалось изобразить вам?

Термин 19. Расширенный или дополнительный искусственный интеллект 

Расширенный или дополнительный искусственный интеллект (Augmented Artificial Intelligence) – это система искусственного интеллекта, которая помогает человеку в улучшении процесса принятия решений. Основная задача такой системы не заменить человека в решении той или иной прикладной задачи, а оказать ему содействие и помощь, с тем чтобы расширить возможности человека.

Впервые термин «intelligence amplification» («усиление интеллекта») упоминается в книге Уильяма Росса Эшби «Введение в кибернетику» в 1956 году.

Расширенный искусственный интеллект улучшает процесс принятия решений человеком как за счет обработки больших объемов данных, которые могут сбить с толку человека, принимающего решения, так и за счет устранения факторов, которые могут искажать или неправильно интерпретировать данные (например, предвзятость или усталость)[48].

Современные системы расширенного искусственного интеллекта основываются на машинном обучении, глубоком машинном обучении и анализе больших данных.

Классическим системам искусственного интеллекта не требуется высокий уровень социального интеллекта, поскольку они предназначены для автономной работы. Но при расширенном интеллекте необходим социальный интеллект, который может обеспечить только человек. На сегодняшний день только человек может дать другим людям объяснения о том, что делает искусственный интеллект.

В сочетании с людьми системы расширенного искусственного интеллекта имеют преимущество «здравого смысла», которого классическим системам искусственного интеллекта, как правило, не хватает из-за их узкого взгляда на поставленную перед ними проблему или задачу[49].

Мы уже говорили с вами, что Яндекс Алиса, Apple Siri, Amazon Alexa или суперкомпьютер IBM Watson относятся к узкому искусственному интеллекту. Справедливо будет сказать, что большинство голосовых помощников являются системами расширенного (дополнительного) искусственного интеллекта, которые не принимают решение за человека, а лишь помогают ему в этом. 

Работаем с Easy Diffusion

Для закрепления наших навыков работы с Easy Diffusion выполним простое упражнение и создадим образ дополнительного искусственного интеллекта.

Для этого выполним следующие действия:

·        Составьте собственные запросы на основании приведенного выше определения. Например, мы написали такие запросы:

a.      «Mechanical metal bear made of silver and platinum with a translucent case inside which you can see the details of the mechanism, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail».

b.     « Augmented Intelligence, cyberpunk, bird robot, cyborg robot, in the forest».

·        В качестве моделей мы выбрали «Realistic Vision» и «DreamShaper».

·        Установим параметр «Image Quality» (Качество рисунка) равным 75.

Жмем кнопку «Make image» / «Сделать изображение».

У нас получились следующие результаты: 

Инструмент: Easy Diffusion

Запрос (Prompt): Mechanical metal bear made of silver and platinum with a translucent case inside which you can see the details of the mechanism, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail

Модель (Model): Realistic Vision

Шаги вывода (Inference Steps): 25

Автор: Диана Чесалова

Инструмент: Easy Diffusion

Запрос (Prompt): Augmented Intelligence, cyberpunk, bird robot, cyborg robot, in the forest

Модель (Model): DreamShaper

Шаги вывода (Inference Steps): 25

Автор: Всеволод Чесалов

 

Термин 20. Искусственный сверхинтеллект 

Искусственный сверхинтеллект (Artificial Super Intelligence, ASI) – это термин, который обозначает наивысшую степень развития искусственного интеллекта, превосходящую человеческие возможности во всех аспектах его жизнедеятельности.

На сегодняшний день систем искусственного сверхинтеллекта так же, как и систем сильного или общего искусственного интеллекта, не существует. Многие ученые считают, что до создания суперинтеллекта пройдет очень много времени, но большинство из них все же сходятся во мнении, что это рано или поздно произойдет.

На мой взгляд, случится это тогда, когда люди смогут создать такие суперкомпьютеры и системы хранения информации, которые будут способны производить вычисления и хранить данные, как наш человечески мозг.

Знаете ли вы, что наш с вами мозг и нервная система – это суперкомпьютер со своей системой хранения данных и интерфейсов взаимодействия с внешним миром?

За обработку информации в нашем мозге отвечают порядка 86-100 млрд нейронов (нейронных клеток), которые меняют свое состояние до 50 раз в сек. Число возможных состояний нашего мозга = 10 1 000 000 (количество возможных комбинаций возбуждения или торможения нейронов), тогда как количество атомов во Вселенной = 10 80.

Кроме того, на сегодняшний день никто не может дать ответ на вопрос, сколько экзабайт (1018) или йоттабайт (1024) данных и в какой форме хранится в нашем мозге.

Исходя из этих скромных данных, мы можем с вами сделать вывод о том, что появление искусственного сверхинтеллекта возможно лишь тогда, когда человечество создаст квантовые носители информации и квантовый суперкомпьютер, сопоставимый по своим вычислительным мощностям с нашим мозгом[50].

Тем не менее ученые из разных стран полны энтузиазма и ведут работы по созданию общего, а затем уже и суперинтеллекта. Приведу некоторые из этих направлений, которые, на мой взгляд, будут вам интересны:

·        Эмуляция работы человеческого мозга. Задача заключается в создании полной цифровой копии человеческого мозга. Для этого осуществляется сканирование всей структуры мозга человека для создания точной цифровой карты его нейронных связей.

·        Мозговые импланты. Ученые работают над тем, чтобы создать такие устройства, которые можно будет встраивать в человеческий мозг для улучшения его работы. Предполагается, что это позволит достичь уровня сверхразума за счет симбиоза человека и машины.

·        Создание эволюционных распределенных систем искусственного интеллекта. Основная идея этого подхода заключается в том, чтобы системы искусственного интеллекта смогли самостоятельно развиваться и эволюционировать с тем, чтобы через несколько этапов превратиться в суперинтеллект.

·        Нейроморфные вычисления. Ученые работают над тем, чтобы создать нейроморфные компьютеры, работа которых основана на работе нейронных и синаптических структур человеческого мозга. Считается, что такие суперкомпьютеры в десятки раз производительнее современных суперкомпьютеров, работающих на графических ускорителях[51].

По моему мнению, вам будет интересна точка зрения, которая имеет отношение к теме искусственного сверхинтеллекта, выдающегося физика-теоретика Стивена Хокинга, которая, возможно, откроет вам новую перспективу нашего с вами будущего: «Боюсь, искусственный интеллект может полностью заменить людей. Если сейчас люди разрабатывают компьютерные вирусы, то в будущем кто-то сможет создать искусственный интеллект, который будет способен улучшать и воспроизводить самого себя. Это станет новой формой жизни, которая превзойдет человека». 

Работаем с Easy Diffusion

Для закрепления наших навыков работы с Easy Diffusion создадим образ искусственного сверхинтеллекта.

Самое интересное в том, чтобы получить изображение суперинтеллекта, который прошел некую эволюцию и стал более совершенным, предлагаю вам провести небольшой эксперимент. Он заключается в том, чтобы после того, как вы получите свое первое изображение, использовать его для генерации второго с применением опции «ControlNet Image».

Шаг 1. Создаем изображение:

·        В качестве базового предлагается следующий запрос: «Artificial superintelligence, cyborg face in profile, symbiosis of man and cyborg, symbiosis of cyborg and nature, journey into the healing power of nature, green forest around, photorealistic, perfect composition, cinematic frame, intricate details, hyperdetailed». Мне очень интересно посмотреть, что у нас получится из симбиоза человека, машины, природы и искусственного интеллекта.

·        В качестве модели выбираем «DreamShaper».

·        Сэмплер (Sampler): DPM++ 2s Ancestral (Kerras).

·        Параметр «Guidance Scale» / «Ориентировочная шкала»: 7,5.

·        Параметр «Image Quality» / «Качество рисунка»: 75.

·        Отключим все четыре опции раздела «Render Settings» / «Настройки рендеринга».

·        Жмем кнопку «Make image» / «Сделать изображение».

Первый результат получился таким:

Шаг 2. После того, как изображение будет создано, наводим курсор мышки на получившееся изображение и выбираем команду «Use for ControlNet» («Использовать для ControlNet»). После чего в панели инструментов появится пиктограмма нашей картинки и нам будет предложено выбрать опции «Filter to apply» («Фильтр для применения») и «Model» («Модель»). Выбираем «Filter to apply: Canny» и «Model: Canny», как это показано на рисунке ниже:

Жмем кнопку «Make image» / «Сделать изображение».

В этот момент система выполнит скачивание той модели, которую мы выбрали, и приступит к созданию нового изображения на основе вашего первого изображения.

Для этого наводим курсор мышки на получившуюся картинку и выполняем команду «Use as Input» («Использовать как входные данные»). Жмем кнопку «Make image» / «Сделать изображение».

Второй результат получился таким:

Наверное, вы уже обратили внимание, что результат выполнения команды «Use for ControlNet» очень похож на тот, когда мы выполняли с вами команду «Use as Input» («Использовать как входные данные»).

Тем не менее между этими командами есть некоторая разница, которая заключается в следующем:

·        Команда «Use as Input» позволяет нам на основе первого изображения и нашего первого описания создать следующую версию первой картинки.

·        Команда «Use for ControlNet», используя дополнительные модели, применяется для создания совершенно новой картинки, но с учетом общего стиля первого изображения. Например, с ее помощью можно на первую картинку нанести лицо знаменитости, изменив наше описание.  

Шаг 3. Давайте оставим все как есть, только изменим наше описание в окне «Enter Prompt» панели инструментов на имя одного из моих любимых актеров – Николаса Кейджа (Nicolas Cage), как это показано ниже:

Как мы с вами видим, внешность нашего робота изменилась на лицо актера Николаса Кейджа:

Таким образом, использовании команды «Use for ControlNet» удобно еще и тем, что, получив нужное нам изображение, мы можем придать ему дополнительные индивидуальные черты.

Еще один пример.

Представим, что перед нами стоит задача из нашего первого изображения с роботом, мы хотим позаимствовать только его позу для нового изображения «Nicolas Cage».

Шаг 4. Выполним следующие действия:

·        Оставим без изменений наше описание в окне «Enter Prompt» панели инструментов с именем актера «Nicolas Cage».

·        Изменим опции «Filter to apply» («Фильтр для применения») на «OpenPose-face only» и «Model» («Модель») на «OpenPose (*)».

·        Жмем кнопку «Make image» / «Сделать изображение».

В результате у нас получилось следующее изображение Николаса Кейджа в позе нашего робота:

Вы можете продолжить свой эксперимент с совершенствованием и изменением изображения искусственного сверхинтеллекта, комбинируя опции «Filter to apply» («Фильтр для применения») и «Model» («Модель»).

Например, если вы хотите придать исходному изображению новое лицо и поменять его стиль, то следующий шаг.

Шаг 5. Выполним следующие действия:

·        В окне «Enter Prompt» панели инструментов пишем имя актера «Nicolas Cage».

·        Изменим опции «Filter to apply» / «Фильтр для применения» на «Lineart Anime» и «Model» («Модель») на «Line Art Anime».

·        Жмем кнопку «Make image» / «Сделать изображение» и получаем следующее изображение:

Обратите внимание на то, что при выборе новой модели будет происходить задержка с рендерингом нового изображения из-за того, что система Easy Diffusion будет загружать их из сети Интернет. Дальнейшее использование моделей влиять на производительность не будет.

Я, в свою очередь, вернулся к первому варианту.

Немного поэкспериментировав, получил следующее изображение искусственного суперинтеллекта:

Инструмент: Easy Diffusion

Запрос (Prompt): Artificial superintelligence, cyborg face in profile, symbiosis of man and cyborg, symbiosis of cyborg and nature, journey into the healing power of nature, green forest around, photorealistic, perfect composition, cinematic frame, intricate details, hyperdetailed

Модель (Model): DreamShaper

Автор: Александр Чесалов

 

Заключение 

Когда я начал писать эту книгу, я поставил перед собой задачу – написать максимально простым и доступным языком учебное пособие для школьников, которое бы помогло им, не обладая глубокими теоретическими и инженерными знаниями, познакомиться с миром современного невероятного искусственного интеллекта.

С этой целью я изучил возможности различных программ и, в конечном итоге, пришел к выводу, что наиболее простой и очень эффективной в работе является система генеративного искусственного интеллекта Easy Diffusion. Эта программа проста в установке, работе и удалении, а самое главное, она предоставляет пользователю широкие возможности для собственного развития и творчества.

В этой книге весь процесс знакомства и обучения работы с программой Easy Diffusion я свел к восьми простым шагам, которые бы помогли вам, не тратя много времени на изучение и прочтение сложных книг, приступить быстро к работе.

После того как вы прошли восемь шагов, у вас появилась возможность получить больше теоретических знаний об искусственном интеллекте.

Из книги вы узнали двадцать самых, на мой взгляд, интересных терминов и определений искусственного интеллекта. Эти термины и определения широко используются учеными, инженерами и другими специалистами по всему миру. Весь материал в соответствующих главах написан достаточно кратко, но емко, по своей сути.

Очень важной особенностью каждой главы является то, что после изучения каждого термина и определения мы выполнили с вами практические примеры работы в Easy Diffusion. Эти примеры позволили нам закрепить базовые навыки и узнать некоторые особенности и приемы работы по улучшению создаваемых нами изображений.

Изучив теорию, вы смело можете точно определить, с какой системой искусственного интеллекта вы работаете. В случае необходимости можете быстро создать нужное вам изображение. А самое главное, после прочтения этой книги вы легко сможете перейти к изучению работы других систем искусственного интеллекта и программных продуктов.

Я более чем уверен, что, научившись создавать уникальные изображения, вы захотите попробовать свои силы в написании стихотворений или рассказов, а может быть, и собственной музыки. На сегодняшний день уже есть много различных систем искусственного интеллекта, которые смогут помочь вам в вашем личностном развитии. Только постарайтесь запомнить, что каким бы ни был совершенным искусственный интеллект той или иной программы, он никогда не заменит человека.

Да, искусственный интеллект – это наша реальность и одно из передовых направлений науки и техники. Он определяет в значительной степени перспективы развития всех остальных современных технологий. Тем не менее современный искусственный интеллект не обладает такими свойствами, как мышление, творчество, эмоции, воля, свобода выбора, и, по большей части, многие из систем искусственного интеллекта не являются этичными и доверенными.

Я надеюсь, книга вам понравилась, и ее основная задача выполнена.

Возможно, вы именно тот человек, который создаст нечто новое и прекрасное в недалеком будущем. Возможно, именно вы примите участие в создании искусственного сверхинтеллекта, который сделает наше общество более гуманным, благополучным и позволит нам увеличить продолжительность нашей жизни, открыть новые возможности для всех людей в гармонично развивающемся и устойчивом мире.

Ваш Александр Чесалов.

Сайт: chesalov.com

Все изображения можно будет скачать по ссылке:

http://chesalov.com/category/artificial-intelligence/

E-mail: aleksander.chesalov@yandex.ru

Для цитирования: Чесалов А.Ю.  Невероятный искусственный интеллект Easy Diffusion 3.0. Учебное пособие для школьников средних и старших классов / А.Ю. Чесалов. – 1-е изд. – Москва: Ridero, 2023. – URL:  304 с. – https://ridero.ru/books/neveroyatnyi_iskusstvennyi_intellekt_easy_diffusion_3_0/ (дата обращения: 21.12.2023). – Текст: электронный.


Список литературы:

[1] Стимпанк. [Электронный ресурс] ru.wikipedia.org URL: https://ru.wikipedia.org/wiki/Стимпанк (дата обращения: 26.07.2023).

[2] Указ Президента Российской Федерации от 10.10.2019 г. № 490 «О развитии искусственного интеллекта в Российской Федерации». [Электронный ресурс] // www.kremlin.ru. URL: http://www.kremlin.ru/acts/bank/44731.

[3] Artificial Intelligence [Электронный ресурс] // absel.ua URL: https://absel.ua/news/tri-tipa-iskusstvennogo-intellekta-ponimanie-ii.htmlobuchenii (дата обращения: 18.02.2022).

[4] Arthur Lee Samuel. [Электронный ресурс] // en.wikipedia.org. URL: https://en.wikipedia.org/wiki/Arthur_Samuel (дата обращения: 14.01.2022).

[5] Source of Arthur Samuel's definition of machine learning. [Электронный ресурс] // datascience.stackexchange.com. URL: https://datascience.stackexchange.com/questions/37078/source-of-arthur-samuels-definition-of-machine-learning (дата обращения: 14.01.2022).

[6] What Is Augmented Intelligence? [Электронный ресурс] digitalreality.ieee.org URL: https://digitalreality.ieee.org/publications/what-is-augmented-intelligence (дата обращения: 31.08.2023). – Текст: электронный.

[7] Большие данные [Электронный ресурс] https://ulgov.ru URL: https://ulgov.ru/page/index/permlink/id/14949/ (дата обращения: 28.03.2023).

[8] Жданов А.А. Автономный искусственный интеллект. – Москва: Издательство Бином, 2009. – 359 с.

[9] Указ Президента Российской Федерации от 10.10.2019 г. № 490 «О развитии искусственного интеллекта в Российской Федерации». [Электронный ресурс] // www.kremlin.ru URL: http://www.kremlin.ru/acts/bank/44731 (дата обращения: 14.01.2022).

[10] Чесалов А.Ю. Глоссариум по искусственному интеллекту и информационным технологиям / А. Ю. Чесалов. – 1-е изд. – Москва: Ridero, 2021. – 324 с. – URL: https://ridero.ru/books/glossarium_po_informacionnym_tekhnologiyam_i_iskusstvennomu_intellektu/ (дата обращения: 21.05.2023). – Текст: электронный.

[11] Системы искусственного интеллекта – их развитие и области применения. [Электронный ресурс] // www.directum.ru. URL: https://www.directum.ru/blog-post/1927# (дата обращения: 16.01.2022).

[12] Остроух А.В. Введение в искусственный интеллект [текст].-Красноярск: Издательство «Научно-инновационный центр», 2020.-249 с.

[13] Искусственный интеллект (ИИ). [Электронный ресурс] // www.ibm.com. URL: https://www.ibm.com/ru-ru/cloud/learn/what-is-artificial-intelligence.

[14] Указ Президента Российской Федерации от 10.10.2019 г. № 490 «О развитии искусственного интеллекта в Российской Федерации». [Электронный ресурс] // www.kremlin.ru. URL: http://www.kremlin.ru/acts/bank/44731.

[15] Баканач М.О., Власкин А.Н. Чесалов А.Ю., Глоссариум по искусственному интеллекту: 2500 терминов / М.О. Баканач, А.Н. Власкин, А. Ю. Чесалов. – 1-е изд. – Москва: Ridero, 2022. – 628 с. – URL: https://ridero.ru/books/glossarium_po_iskusstvennomu_intellektu_2500_terminov/ (дата обращения: 21.05.2023). – Текст: электронный.

[16] Universal Artificial Intelligence, and how much might cost Real AI Model. [Электронный ресурс] futurium.ec.europa.eu URL: https://futurium.ec.europa.eu/fr/european-ai-alliance/best-practices/universal-artificial-intelligence-and-how-much-might-cost-real-ai-model?language=fr (дата обращения: 30.08.2023).

[17] Artificial Narrow Intelligence (ANI) [Электронный ресурс] https://dic.academic.ru URL: https://dic.academic.ru/dic.nsf/ruwiki/318696 (дата обращения: 27.01.2022).

[18] What Is Narrow Artificial Intelligence (AI)? Definition, Challenges, and Best Practices for 2022. [Электронный ресурс] www.spiceworks.com URL: https://www.spiceworks.com/tech/artificial-intelligence/articles/what-is-narrow-ai/#:~:text=Artificial%20narrow%20intelligence%20(ANI) %20is,as%20poker%2C%20chess%2C%20etc. (дата обращения: 27.07.2023).

[19] Шалагинов А. Что такое узкий ИИ, слабый ИИ и сильный AI [Электронный ресурс] www.spiceworks.com URL: https://shalaginov.com/2021/09/28/narrow-ai-general-ai/ (дата обращения: 29.04.2023).

[20] Nouvelle AI [Электронный ресурс] en.wikipedia.org URL: https://en.wikipedia.org/wiki/Nouvelle_AI (дата обращения: 26.03.2023).

[21] Friendly artificial intelligence [Электронный ресурс] dic.academic.ru URL: https://dic.academic.ru/searchall.php?SWord=Friendly+artificial+intelligence+&from=ru&to=xx&did=&stype=0 (дата обращения: 09.03.2022).

[22] Чесалов А.Ю. Как создать Центр искусственного интеллекта за 100 дней / А. Ю. Чесалов. – 1-е изд. – Москва: Ridero, 2021. – 314 с. – URL: https://ridero.ru/books/kak_sozdat_centr_iskusstvennogo_intellekta_za_100_dnei/ (дата обращения: 21.05.2023). – Текст: электронный.

[23] Что такое ИИ, ориентированный на человека? [Электронный ресурс] research.ibm.com URL: https://research.ibm.com/blog/what-is-human-centered-ai (дата обращения: 29.08.2023).

[24] Auxiliary Learning as a step towards Artificial General Intelligence. [Электронный ресурс] arxiv.org URL: https://arxiv.org/abs/2212.00061 (дата обращения: 28.08.2023).

[25] Commonsense knowledge (artificial intelligence). [Электронный ресурс] en.wikipedia.org URL: https://en.wikipedia.org/wiki/Commonsense_knowledge_(artificial_intelligence) (дата обращения: 30.08.2023).

[26] Здравый смысл. [Электронный ресурс] bigenc.ru URL: https://bigenc.ru/c/zdravyi-smysl-7e3cac (дата обращения: 30.08.2023).

[27] Документация отбора получателей поддержки исследовательских центров в сфере искусственного интеллекта, в том числе в области «сильного» искусственного интеллекта, систем доверенного искусственного интеллекта и этических аспектов применения искусственного интеллекта. [Электронный ресурс] ac.gov.ru URL: https://ac.gov.ru/uploads/_Projects/AI_otbor/Documents.pdf (дата обращения: 30.08.2023).

[28] Local Interpretable Model-Agnostic Explanations (LIME): An Introduction [Электронный ресурс] www.oreilly.com URL: https://www.oreilly.com/content/introduction-to-local-interpretable-model-agnostic-explanations-lime/ (дата обращения: 01.05.2023).

[29] What is Explainable AI (XAI)? [Электронный ресурс] towardsdatascience.com URL: https://towardsdatascience.com/what-is-explainable-ai-xai-afc56938d513 (дата обращения: 29.04.2023).

[30] Lime [Электронный ресурс] github.com URL: https://github.com/marcotcr/lime (дата обращения: 01.05.2023).

[31] Рекомендация по этике искусственного интеллекта. [Электронный ресурс] // en.unesco.org. URL: https://en.unesco.org/artificial-intelligence/ethics#recommendation (дата обращения: 30.04.2023).

[32] Проект Рекомендации об этических аспектах искусственного интеллекта [Электронный ресурс] // en.unesco.org. URL: https://unesdoc.unesco.org/ark:/48223/pf0000378931_rus (дата обращения: 01.05.2023).

[33] Доклад комиссии по социальным и гуманитарным наукам (SHS). [Электронный ресурс] // unesdoc.unesco.org. URL: https://unesdoc.unesco.org/ark:/48223/pf0000379920_rus.page=16 (дата обращения: 29.04.2023).

[34] Документация отбора получателей поддержки исследовательских центров в сфере искусственного интеллекта, в том числе в области «сильного» искусственного интеллекта, систем доверенного искусственного интеллекта и этических аспектов применения искусственного интеллекта. [Электронный ресурс] ac.gov.ru URL: https://ac.gov.ru/uploads/_Projects/AI_otbor/Documents.pdf (дата обращения: 30.08.2023).

[35] Trustworthy artificial intelligence. [Электронный ресурс] link.springer.com URL: https://link.springer.com/article/10.1007/s12525-020-00441-4 (дата обращения: 30.08.2023).

[36] Ethics guidelines for trustworthy AI. [Электронный ресурс] digital-strategy.ec.europa.eu URL: https://digital-strategy.ec.europa.eu/en/library/ethics-guidelines-trustworthy-ai (дата обращения: 30.08.2023).

[37] Доклад комиссии по социальным и гуманитарным наукам (SHS). [Электронный ресурс] // unesdoc.unesco.org. URL: https://unesdoc.unesco.org/ark:/48223/pf0000379920_rus.page=16 (дата обращения: 29.01.2022).

[38] Gartner назвала 12 самых перспективных технологий следующего года. [Электронный ресурс] // digitalms.ru. URL: https://www.digitalms.ru/media/news/19/ (Дата обращения: 28.08.2022).

[39] Что такое генеративный искусственный интеллект? [Электронный ресурс] aws.amazon.com URL: https://aws.amazon.com/ru/what-is/generative-ai/ (дата обращения: 30.08.2023).

[40] Что такое GPT? [Электронный ресурс] aws.amazon.com URL: https://aws.amazon.com/ru/what-is/gpt/ (дата обращения: 30.08.2023).

[41] Artificial Intelligence for IT Operations (AIOps) [Электронный ресурс] www.cio.com URL: https://www.cio.com/article/196239/what-is-aiops-injecting-intelligence-into-it-operations.html (дата обращения: 07.07.2022).

[42] Artificial Intelligence for IT Operations (AIOps) [Электронный ресурс] www.gartner.com URL: https://www.gartner.com/en/information-technology/glossary/aiops-platform (дата обращения: 07.07.2022).

[43] Искусственный интеллект для ИТ-операций [Электронный ресурс] //networkguru.ru URL: https://networkguru.ru/aiops-artificial-intelligence-for-it-operations/ (дата обращения: 07.07.2022).

[44] Чесалов А.Ю. Глоссариум по четвертой промышленной революции: более 1500 основных терминов для создания будущего / А. Ю. Чесалов. – 1-е изд. – Москва: Ridero, 2023. – 594 с. – URL: https://ridero.ru/books/glossarium_po_chetvertoi_promyshlennoi_revolyucii_bolee_1500_osnovnykh_terminov_dlya_sozdaniya_budushego/ (дата обращения: 21.05.2023). – Текст: электронный.

[45] Распределенный Искусственный Интеллект [Электронный ресурс] // ru.knowledgr.com URL: http://ru.knowledgr.com/00164495/ (дата обращения: 14.02.2022). – Текст: электронный.

[46] Jagreet Kaur. Distributed Artificial Intelligence Latest Trends | 2023. [Электронный ресурс] www.xenonstack.com URL: https://www.xenonstack.com/blog/distributed-ai-latest-trends (дата обращения: 31.08.2023). – Текст: электронный.

[47] Deshmukh A. Distributed artificial intelligence [Электронный ресурс] www.eolss.net URL: https://www.eolss.net/sample-chapters/c15/E1-29-02-04.pdf (дата обращения: 31.08.2023). – Текст: электронный.

[48] What Is Augmented Intelligence? [Электронный ресурс] digitalreality.ieee.org URL: https://digitalreality.ieee.org/publications/what-is-augmented-intelligence (дата обращения: 31.08.2023). – Текст: электронный.

[49] Dawn Kawamoto. What Is Augmented Intelligence? [Электронный ресурс] builtin.com URL: https://builtin.com/artificial-intelligence/augmented-intelligence (дата обращения: 31.08.2023). – Текст: электронный.

[50] Чесалов А.Ю. Как создать Центр искусственного интеллекта за 100 дней / А. Ю. Чесалов. – 1-е изд. – Москва: Ridero, 2021. – 314 с. – URL: https://ridero.ru/books/kak_sozdat_centr_iskusstvennogo_intellekta_za_100_dnei/ (дата обращения: 21.05.2023). – Текст: электронный.

[51] Vijay Kanade. What Is Super Artificial Intelligence (AI)? Definition, Threats, and Trends [Электронный ресурс] www.spiceworks.com URL: https://www.spiceworks.com/tech/artificial-intelligence/articles/super-artificial-intelligence/ (дата обращения: 31.08.2023). – Текст: электронный.

Tags:
Hubs:
If this publication inspired you and you want to support the author, do not hesitate to click on the button
-5
Comments12

Articles