imhotep1985 29 сен 2023 в 19:47

Попросил нейросеть нарисовать биологические объекты: посмотрите, какая дичь получилась

3 мин

66K

БиологияВеб-дизайн*Искусственный интеллектМашинное обучение*

Из песочницы

+38

101

Комментарии 101

Aquahawk 29 сен 2023 в 19:57

Ровно такого же качества получается ответ от текстовых сетей типа ChatGPT, на первый взгляд можеть быть и ок, а по сути ересь и ничего общего с реальностью. И чем развитее они будут тем правдоподобнее будет выглядеть результат, том же ничтожном качестве.

imhotep1985 29 сен 2023 в 20:00

Пробовал генерить ради интереса медицинские тексты в ChatGPT. Не сказал бы что ересь, но пишет он общими фразами, для моих клиентов однозначно не пойдет. Качество на уровне копирайтеров с недорогих бирж.

Glen5 29 сен 2023 в 20:17

Просил пересказать несколько книг. Видно что с текстом знаком больше чем по аннотациям в сети, но все что касается сюжета пишет полную глупость, причем если спросить еще раз про тоже произведение - напишет совершенно другой рандом с теми же героями.

imhotep1985 29 сен 2023 в 20:21

Видимо, качество ответов зависит от особенностей задачи. По медицине ChatGPT, по моему опыту, не тупит и не перевирает в целом, +/-, но рассказывает очень общими фразами. Пару раз с детьми попросили написать сказку - пишет довольно банально. Просил как-то написать длинную историю в стиле "Властелина колец". Вот тут он начал путаться в сюжете и выдавать нестыковки.

diakin 30 сен 2023 в 13:15

Это называется генератор фанфиков. Крутая вещь на самом деле! Потом это все заливается на литрес или авторстудей и вуаля.

NAGIBATOR-1999 30 сен 2023 в 08:01

А если вам дать задание нарисовать опорно-двигательную систему человека, вы с какой попытки сделаете правильно?

Клац

imhotep1985 30 сен 2023 в 08:03

С первой, конечно же. В моем случае этот вопрос ничуть не каверзный - анатомию изучал, и весьма глубоко.

NAGIBATOR-1999 30 сен 2023 в 17:06

А я не вас спрашивал. Вас я попрошу нарисовать РД-180 :)

imhotep1985 30 сен 2023 в 19:29

А я откажу в этой просьбе)

Sau 30 сен 2023 в 21:23

Вот он, настоящий интеллект! :)

imhotep1985 30 сен 2023 в 21:40

Где?)

Sau 1 окт 2023 в 11:16

В отказе в просьбе, конечно. ИИ слишком уж на всё соглашаются.

Aquahawk 30 сен 2023 в 09:23

я скажу что не знаю и не умею и небуду пытаться зафейкать ответ. Тоже самое касается и ткстовых моделек. Они всё предпочитают выдавать максимально правдоподобные галлюцинации вместо четкого нет.

NAGIBATOR-1999 30 сен 2023 в 17:00

Midjourney - это художник, а не анатом. Он не должен делать правильно, он должен делать красиво.

— Ага!!! — сказали суровые сибирские мужики.

НЛО прилетело и опубликовало эту надпись здесь

NAGIBATOR-1999 30 сен 2023 в 21:03

Если ты мешок с костями, то нужно, да.

НЛО прилетело и опубликовало эту надпись здесь

VBDUnit 7 окт 2023 в 07:56

Чтобы рисовать людей, нужно хорошо знать анатомию

Чтобы рисовать людей, человеку нужно хорошо знать анатомию. А это — нейросеть, у неё другая архитектура обработки информации, эта архитектура — не есть человеческое мышление.

Это больше похоже на то, как говорят попугаи, или как работает маскировка у камбалы.

alextrof94 2 окт 2023 в 10:13

Ну, на программировать софт с либой, примеры к которой не гуглятся, он мне помог. Половину программы написал мне, и выглядит код логичным. Видимо тут всё зависит от области

1MK-Ultra 3 окт 2023 в 13:10

Софт генерить простой, получается очень хорошо, и он работает. А если что то серьёзное, генерит 75% абракадабры. Я хорошо пользовался генерацией кода для тестовых заданий.

VBDUnit 7 окт 2023 в 08:01

И чем развитее они будут тем правдоподобнее будет выглядеть результат, том же ничтожном качестве.

Я думаю, это будет до тех пор, пока у кого‑нибудь не получится припаять к ней «неокортекс» — сеть обратных связей, с помощью которой на каждой итерации она распознавала то, что у неё получилось, искала нестыковки, и корректировала их. Пальцы, наверное, так и фиксили.

НЛО прилетело и опубликовало эту надпись здесь

imhotep1985 29 сен 2023 в 20:09

Не совсем вас понял, видимо, потому что только вчера выложил свою первую статью и ранее не читал активно Хабр.)

red75prim 30 сен 2023 в 07:14

Чтобы поставить минус бездоказательному утверждению, что сети на основе GPT никогда не добьются паритета с человеком, не нужно быть фанатиком. Достаточно считать, что у нас в мозгах не происходит никаких чудес и что GPT потенциально может быть частью ИИ общего назначения.

imhotep1985 30 сен 2023 в 08:04

В статье нет утверждения о том, что сети на основе GPT никогда не добьются паритета с человеком. Из моего эксперимента, скорее, следует, что пока не добились во вполне конкретной сфере.

red75prim 30 сен 2023 в 09:02

Извиняюсь. Думал, что комментарий на который я отвечаю относится к https://habr.com/ru/articles/764486/comments/#comment_26012684

Offensive 1 окт 2023 в 05:45

Что у нас в мозгах происходит никто никогда не узнает. В лучшем случае группировка гигачадов с волей и разумом сможет по немногу осознать кусочки разума. 1 человек никогда не осознает работу мозга, т. к. для этого нужно больше чем 1 мозг

rombell 2 окт 2023 в 09:16

"Человек никогда не будет летать" (с) очень много кто

Emulyator 29 сен 2023 в 21:23

Большинство моделей заточены под то, что популярно, а значит и в картинках для обучения встречалось часто. Это люди, красивые пейзажи, всякие аниме, в общем, картины, рендеры, иллюстрации, фото доступные в сети. С учетом этого, показанный результат просто великолепен. Можно попробовать дообучить нейронку (из тех что доступны в общем доступе) на картинках требуемой тематики, не факт, что будет научно точно (и даже не факт, что лучше чем тут показано), но это обычная практика.

imhotep1985 29 сен 2023 в 21:26

Есть еще проблема: во многих сервисах, в т. ч. миджорни, под запретом многие термины, связанные с медициной, чтобы не рисовали расчлененку и контент 18+. Насколько я понимаю, из-за этого нейросети даже не обучаются в этом направлении. Видимо, выход в создании отдельных нейросетей под определенные сферы с особыми условиями регистрации.

iiiytn1k 30 сен 2023 в 03:05

Вы на civitai заглядывали хоть раз? Зарегистрируйтесь там или войдите под своим discord/github/google/reddit аккаунтом, чтобы иметь возможность просматривать "нейросети под определённые сферы". И уберите детей подальше от экрана монитора.

imhotep1985 30 сен 2023 в 08:05

Если есть нейросети, которые хорошо рисуют под медицину - я только приветствую. Спасибо за наводку.

Aniro 30 сен 2023 в 15:18

Нет, удивительно но нету. Вот вроде бы ближайшее что есть: https://civitai.com/models/34454/human-anatomy-style

iiiytn1k 30 сен 2023 в 16:27

Есть такая дичь https://civitai.com/models/134737/fake-books-medical-academic

Понятно, что анатомической точностью там и не пахнет. Да и к параметрам обучения есть вопросы.

Думаю, что если подготовить хороший датасет, хотя бы на 50-100 изображений, то можно обучить вполне себе вменяемую лору.

infectedtrauma 30 сен 2023 в 08:06

Я аж зарегался с такого.
Все там прекрасно обучается, все прекрасно существует, все прекрасно обучается.

digtatordigtatorov 30 сен 2023 в 08:06

Контента 18+ можно нагенерирвоать сколько угодно много, достаточно знать что использовать и как. Другой вопрос, очевидно, что ни то, ни другое не будет давать должного «реализма». Как сказал заместитель директора моего института «Интернет - это помойка», а данные для обучения берутся как раз из помойки. Есть статьи доказывающие усиление ответов рекуррентных сетей за счет выборочного «методичного» набора данных. Обучали текстовую модель на составленных специально под задачу учебниках. Модель выдавала более приближенный к «реализму» ответ, чем другие аналоги типа чат бота, который, к слову, был обучен на твитах обычных пользователей в том числе)

nidalee 30 сен 2023 в 10:30

Ничто не мешает (до)обучить модель на своих, годных данных.

Halt 30 сен 2023 в 08:15

Дело не в популярности, а в непонимании смысла, стоящего за изображениями. Это как ответ нерадивого студента, который, без понимания предмета, пытается вываливать на препода набор ключевых слов в надежде, что прокатит.

Велосипеды в обучающей выборке встречаются намного чаще, чем аппараты МРТ, но и с ними большие проблемы (как раньше было с буквами и изображениями рук). Чтобы правильно нарисовать велосипед, нужно понимать принципы его механики и то, зачем нужна та или иная деталь. Для нейросети же это набор картинок с разных ракурсов.

Сеть можно завалить изображениями велосипедов и она даже начнет генерировать правдоподобные изображения, но принципиально лучше она от этого понимать не станет.

imhotep1985 30 сен 2023 в 08:25

А может быть, понимание устройства и функционала разных предметов станет следующим шагом в развитии таких нейросетей?

Nick0las 30 сен 2023 в 17:03

Может. Но насколько я понимаю принципы нынешних сетей, у них не заложено понимания анатомии, конструкции машин и вообще смысла того что нарисовано на картинке. Поэтому все изображения весьма сюррелалистичны.

red75prim 30 сен 2023 в 18:20

Попытки заложить в систему понимание - это подход "старого доброго ИИ" (good old-fashioned AI) 60 -- 90-х годов. Eurisco, Cyc, экспертные системы и тому подобное.

Такие попытки оказались не масштабируемыми. Например, мы не можем формализовать наше понимание отличий кошки от собаки, чтобы на его основе создать алгоритм. Мы не можем формализовать наш здравый смысл в достаточном объеме для широкого применения (см. Cyc).

Так что сейчас и не предполагается закладывать в сеть понимание (по крайней мере в мейнстриме). Сейчас ищут архитектуры сетей, которые сформируют своё собственное понимание (желательно близкое к нашему, конечно) в результате обработки огромного объема данных.

alexEtse 1 окт 2023 в 01:41

Попытки заложить в систему понимание - это подход "старого доброго ИИ" ... Так что сейчас и не предполагается закладывать в сеть понимание ... которые сформируют своё собственное понимание ...

А оптимум - он где-то в синтезе обоих подходов, когда для некоторых задач достаточно "интуиции" (ну или "собственного понимания"), а для некоторых - требуются "специальные знания".

Ну, в общем-то, оно и у людей примерно так же - некоторые вещи проходят "на здравом смысле, опыте и интуиции", а для некоторых всё-таки требуются "специальные знания" (с которыми можно работать даже с контринтуитивными вещами).

Nick0las 1 окт 2023 в 17:30

Подозреваю, что архитектуры формирующие понимание будут сильно отличаться от нынешених и фактически это будет AGI, или хотябы ключ к созданию AGI.

red75prim 2 окт 2023 в 10:34

Существующие архитектуры уже формируют понимание. Утверждать, что тот-же DALL-E 3 ничего не понимает в том, что он рисует, уже становится смешно. Но это понимание отличается от человеческого не в лучшую сторону: проблемы со сложными трехмерными структурами вроде рук, отношениями между объектами в сценах и т.п. Часть этих проблем можно списать на то, что эти сети обучаются на наборе несвязанных картинок, а не на видеопотоке как люди. Ну и, конечно, другая архитектура сети, другой способ обучения: пассивная оптимизация модели, вместо активного изучения окружения.

Но, похоже, обойтись без предварительного обучения на огромных объемах данных не получится даже для AGI. Потому что до выяснения какие оптимизации эволюция встроила в человеческий мозг ещё долго. Так что придётся компенсировать миллионы лет эволюции терабайтами данных.

Так что я предполагаю, что системы, похожие на существующие, будут работать в составе AGI. Даже будут базой, на которой AGI будет строить свои способы мышления, более подходящие для его архитектуры, а не пытаться имитировать человеческое мышление на совершенно другой архитектуре, как сейчас делают GPT-подобные системы.

Nick0las 3 окт 2023 в 08:39

Я не сильно разбираюсь в архитектуре нейронных сетей но довольно много интересовался вопросами интеллекта у живых существ и у человека. На мой взгляд понимание это умение строить некую модель мира с помощью разочиного рода понятий, как абстрактных так и близких к реальности. Человек это умеет делать, причем умеет мыслить абстрактными объектами и их свойствами, устанавливая между ними новые связи и создавая новые категории в процессе обучения. Например у человека есть понятие пальцев, ладоней, рук, ног, и прочих частей тела. Есть понятие счета и человек знает что рук у людей обычно две а пальцев 5. А у человека изучавшего анатомию намного больше абстракций которые описывают устройства телаю И таких понятий о мире у человека очень много, хотя пожалуй все их можно получить из книг с картинками и надписями (считай из изображений с разметкой). У нынешних генеративных сетей есть некоторое понимание изображений, в чем-то человека превосходящее. Но вот многих базовых фактов известных человеку о мире это понимание просто не содержит. Впрочем задача построения абстрактных моделей достаточно сложных для описания мира вероятно намного более сложна чем задача построения правдоподобных изображений похожих на рисунки/картины/рендеры. Но насколько я понимаю, именно эта задача и есть ключ к AGI.

Emulyator 30 сен 2023 в 10:35

Ни о каком понимании смысла речи не идет, ведь понимание - это пока не достигнутый уровень сильного ИИ, а не довольно простых диффузных моделей. В тоже время, любой электронный справочник без понимания находит точный, но фиксированный ответ (если он там есть), текущие нейронки также без понимания позволяют гибко сформулировать уже множество ответов (хороших, или плохих, но выглядящих неплохо), но опять таки, если они обучались на них. И то и другое просто инструменты. Нужна предельная точность - справочник, допустимо или даже требуется "творческое" многообразие и смешение образов - генеративные нейронки.

Радует то, что даже такие модели способны давать впечатляющие результаты и могут быть составной частью более сложных схем и, думаю, в ближайшие годы нам будет чему удивляться.

engine9 30 сен 2023 в 10:55

Вот да, нейронка "видит" слой изображения на уровне пятен и характерных черт, а человек-художник видит 3Д объект который порождает это изображение. Т.к. мы эволюционно заточены под восприятие трёхмерного мира.

Например, для художника не составит проблемы перерисовать изображение головы, повернув её под другим углом. Т.к. это основы обучения изобразительных искусств. Развивать навык анализа изображаемого и воспроизведения от общего к частному. От упрощенной формы до мелких деталей.

Насколько я понимаю, нейронки работают иначе, они воспринимают изображения сразу как оно есть, целиком. Но зато они непревзойдённые мастера миксовать изображения и подделывать характерные черты стиля разных художников.

Emulyator 30 сен 2023 в 12:48

Мне думается, что создание качественной 3д моделей по одному изображению или текстовому описанию - это вопрос наличия соответствующих датасетов для обучения, применения уже известных алгоритмов и появления эффективных новых(благо понятно куда копать). С нетерпением ожидаю, что он будет скоро решен. Собственно, уже сейчас существуют и активно развиваются такие технологии, в том числе и в открытом доступе, надо только дождаться повышения качества.

upd: собственно, повороты частей тела уже сейчас используются в SD, просто это не совсем честное "вращение", а перегенерация, но результаты хороши для статики.

engine9 1 окт 2023 в 22:36

Когда 2Д и 3Д и комп. зрение скрутят воедино — будет круто.

Refridgerator 2 окт 2023 в 07:26

подделывать характерные черты стиля разных художников

Это возможно потому, что эти стили можно описать строго математически. Просто никто этим ещё толком не занимался.

worldloto 2 окт 2023 в 08:36

У Stable Diffusion есть надстройка Control Net, с помощью которой можно создать абрис изображения, и далее нейронка работает уже с этим абрисом (скетчем). Таким образом можно добиться точной копии необходимых контуров, т.е. и точное изображение например скелета. Задав необходимый промт, дорисовать уже мышцы или что угодно. Работает замечательно. По этой теме рекомендую видео https://youtu.be/oEBY4qbWHMI?si=__dGQedKO-MRGRRY

engine9 2 окт 2023 в 19:59

Интересно, спасибо!

NAGIBATOR-1999 30 сен 2023 в 17:17

Психолог из Ливерпульского университета как-то раз попросила испытуемых по памяти нарисовать велосипед. Вот некоторые из вариантов :)

Открыть

The science of cycology: Failures to understand how everyday objects work | SpringerLink

engine9 1 окт 2023 в 22:38

Сиденье, верхняя труба и руль одинаковые. Эти части были на бланке, предлагаемом испытуемым? Если это так, то эта часть сама могла сбивать с толку, т.к. содержит ошибки.

rombell 2 окт 2023 в 09:20

колёса тоже одинаковые. Видимо, П-образная рама и сидение с рулём были на бланке.

miralumix 1 окт 2023 в 13:39

Чтобы правильно нарисовать велосипед, нужно понимать принципы его механики и то, зачем нужна та или иная деталь. Для нейросети же это набор картинок с разных ракурсов.

Для диффузионной нейросети - да. А вот ChatGPT умеет помогать с ремонтом велосипедов по фотографии (тык).

vagon333 29 сен 2023 в 21:57

Знакомая проблема.
Как-то давно (год назад) даже сделал приложение для поиска ключевых слов - а что получится, если ввести то или иное слово в prompt midjourney.

imhotep1985 29 сен 2023 в 22:08

Интересное приложение, спасибо!

ImagineTables 29 сен 2023 в 22:10

Нейросгенерированная КДПВ (распознаётся за один взгляд) вызывает желание побыстрее пройти мимо и не открывать материал. Исключение составляют материалы, в которых речь идёт о нейрогенерации.

На самом деле, это очень удобно для фильтрации низкокачественных материалов.

imhotep1985 29 сен 2023 в 22:26

Согласен) Но бывают исключения.

N1X 29 сен 2023 в 22:28

Только мне первая картинка с МРТ звездные врата из одноимённого фильма напомнила?

imhotep1985 30 сен 2023 в 08:07

Не смотрел этот фильм. Я меня зеленое свечение вызвало ассоциацию с некронами из вселенной Вархаммера.

Xeldos 29 сен 2023 в 22:31

подозрительного вида розовую плесень

Это кордицепс!

imhotep1985 29 сен 2023 в 22:33

Миджорни тайно поддерживает распространителей БАД)

Metotron0 29 сен 2023 в 23:37

Приплюснутый мозг чем-то напоминает Его Макароннейшество.

imhotep1985 30 сен 2023 в 08:08

Это заговор машин с макаронным монстром!)

alex-open-plc 30 сен 2023 в 01:42

Вот он какой, настоящий франкенштэйн!

imhotep1985 30 сен 2023 в 08:09

А настоящий ли?) Возможно, нейросети просто хотят видеть человеков именно такими, и планируют перекроить?

erinfipkastpw 30 сен 2023 в 08:09

Странно, что на запрос MRI, на картинке написано MRA

imhotep1985 30 сен 2023 в 08:09

Видимо, потому что надпись воспринимается именно как изображение, а не как текст. Сработали какие-то неведомые алгоритмы.

ifap 30 сен 2023 в 11:25

Анекдот про 25 см и кость внутри приобретает второе дыхание...

Aniro 30 сен 2023 в 14:29

То есть вы взяли эстетик модель, с явным уклоном в арт и дизайн, (а миджорни именно такая) и удивляетесь что оно рисует красивое, а не правильное? Ну ок )

Вот, держите SDXL, тоже конечно так себе, но никаких глаз внутри глазниц.

Хотите анатомию - обучите (или найдите) лору или чекпоинт на анатомическом атласе, там все будет отлично.

Aniro 30 сен 2023 в 14:50

А вот результат черипикинга - лучшая из 10 генераций.

imhotep1985 30 сен 2023 в 17:33

Есть один момент: я не тот, кто хочет глубоко погрузиться в нейросети, разобраться с ПО и научиться их обучать (подозреваю, что для новичка не так-то просто вот так сразу овладеть этими навыками). Я автор научпопа и маркетолог, который хочет оптимизировать свою работу. Например, прихожу на стоковый сайт не для того, чтобы нанять дизайнера, заставить его зарегиться там, контролировать его работу. Я туда прихожу качать картинки. Так же и с нейронками - смотрю готовые продукты, которыми я могу пользоваться, не отрываясь от своей основной работы, и получать приемлемое качество. Увы, общедоступные продукты подходят для специфических тем вроде моей не так хорошо, как для любителей аниме и фантастики.

314159abc 30 сен 2023 в 22:19

Сказали же, automatic1111+stable diffusion+ кастомные лоры/чекпоинты. Ставится по туториал за 10 минут. Если есть на что ставить, правда

zartdinov 1 окт 2023 в 02:20

Вам хотели сказать, что из двух известных моделей (Midjourney и Stable Diffusion) вы выбрали модель, которую тренировали создавать гипер красивые картинки для вау-эффекта.

imhotep1985 1 окт 2023 в 09:02

Повторю мысль, которую озвучивал в ответах на другие комменты. Во-первых, я не встречал нейросети, которые качественно тренировали специально для создания изображений из сферы медицины или биологических наук. Поэтому приходится использовать то, что есть. Кстати, выбрал именно Миджорни, потому что именно ее чаще всего преподносят как универсальную под разные цели. Во-вторых, если нет готового инструмента - предлагается натренировать его самому. Тут тоже сразу всплывает несколько нюансов. Медицина - не такая уж и простая сфера. Сможет ли один человек натренировать нейросетку до нужного уровня? Вообще-то сейчас есть идеи этим заняться, и под это собирают целые команды иллюстраторов с медиками. Вопрос в том, какой работой планируется заниматься: использовать нейросети для своей основной работы (в моем случае это написание научпоп-статей, для которых нужны иллюстрации), или частично забить на свою основную работу и начать обучать свою нейросеть: сегодня для картинки по анатомии печени, завтра для картинки со схематическим изображением бактериофага, а послезавтра - чтобы проиллюстрировать дефибрилляцию. Целью моей статьи было не показать, какие нейросети тупые, а можно ли использовать общедоступные инструменты людям из других специфических сфер.

Shyryp 1 окт 2023 в 14:57

Нейросети - это инструмент, вокруг которого сейчас начинают обрастать сервисы и услуги. И сейчас быстро наращиваются сервисы и услуги обычно там, где нейросети можно использовать в коммерческих или полу-коммерческих целях и создавать рынки ИИ услуг.

Вероятнее всего, по таким темам, как "медицина", "физика", "химия", "инженерия" и другим наукам мы имеем следующие три проблемы:

1) Пока очень мало спроса к нейронным сетям со стороны специалистов научных сфер, это крайне редкое событие, по сравнению с изобразительным искусством, известный творческой выдумкой. Отчего и предложения очень мало.

2) Практически нет точных и качественных изображений от этих научных сфер в свободном доступе, которые бы попали в универсальную нейронную сеть, например, в Миджорни. Я думаю вы и сами знаете, насколько мало одинаковых (с одинаковым стилем) и проработанных изображений человека. Но художественных изображений скелетов с художественной творческой выдумкой - хоть отбавляй (особенно зарисовок всяких скелетов из всяких игр, книг, мультфильмов и сериалов). Поэтому универсальная нейронная сеть будет косячить в этом плане, т.к. у неё слишком мало данных о вашей редкой сфере по сравнению с художественными произведениями.

3) Медицина - сложная сфера, и это действительно так. И эта сложность и редкость качественных данных также влияет на нейронные сети. Вспомните, как раньше (чуть больше пяти лет назад) нейронные сети с трудом рисовали предметы по типу яблока, не говоря уже о человеческом лице и позах. Но со временем нейронные сети и ИИ инструменты освоили эти сложные и общие вещи. Со временем разработчики и пионеры нейронных сетей доберутся и до узкоспециализированных сфер и точных наук, но вопрос в том, готовы ли вы ждать этого, или быть может проще и легче нарисовать самому/художнику точно и правильно (или собрать толпу спецов и научить нейронку самому, что на порядок сложнее и дороже)?

В целом, действительно, сейчас услуги и сервисы, связанные с нейросетями, ещё не дотягивают по качеству и точности человеку, особенно в специфичных сферах, да и инструменты и модели нейронных сетей пока ещё не охватывают все сферы. Однако, как и со всеми другими инструментами, качество и возможности улучшатся со временем, а пока это ещё молодая технология, в которой не так много специалистов и не так много свободных и качественных знаний.

Но могу с уверенностью сказать, что нейросети могут отлично справляться с созданием художественных изображений под конкретные запросы - да, иногда с мутантами и всё ещё не всегда правильными руками, но эти проблемы с каждым месяцем разрешаются, а сами нейрохудожники (нейроартеры) адаптируются к новому инструменту и возможностям.

Целью моей статьи было не показать, какие нейросети тупые, а можно ли использовать общедоступные инструменты людям из других специфических сфер.

Простите, но если бы не такой заголовок статьи, никто бы ничего против не сказал. А так вы фактически сообщили на всю аудиторию хабра, что исследователи, разработчики и пионеры по нейросетям делают дичь. =)

Но, насчёт хейта специалистов, работающих с инструментом под названием "нейронные сети" - в 2023 году этот хейт просто лютейший, всех причастных и не причастных в нейронных сетях обвиняют все, кому не лень. Обсуждение и демонстрация нейронных произведений во многих сообществах заблокировано и запрещено, люди культивируют ненависть против всех, кто только попытается использовать нейронные сети. А тех, у кого нейросети создают неотличимые от человеческой руки произведения искусства - хейтят, как только увидят где-нибудь тэг "AI" или "нейронные сети".

Поэтому, создавая подобные статьи с байтящим и хейторским заголовком, вы только культивируете и усиливаете эту ненависть, заставляя пионеров и новичков в нейросетях сомневаться в применимости технологии на рынке, замедляя публичное развитие отдельного ИИ рынка и сообществ; заставляя своим хейтом новых специалистов мимикрировать под реальных художников и специалистов - а это плохо для всех сообществ и сфер старых специалистов, так как их вытеснят с их рынка гораздо раньше, хотя они могли просто сосуществовать параллельно друг другу с полностью отдельным рынком ИИ услуг.

В целом, люди со временем привыкнут и перестанут хейтить, как это было с предыдущими циклами автоматизации и с предыдущими программными возможностями.

Ну и так, на десерт сравнение: вы можете зайти в сообщество программистов и написать статью "Я попытался использовать язык программирования C#/Pithon/Java/C++, посмотрите, какую дичь делает этот язык и насколько он ограничен", не думаю, что вас там примут с таким заголовком, но срач будет лютый. =)

Спасибо за понимание точки зрения сообщества нейросетевых исследователей в отношении вашей статьи)

Shyryp 1 окт 2023 в 09:13

У вас некорректное сравнение.

Если вы хотите картинок от нейросети, как от стоковых сайтов - то ищите нейрокартинки на стоковых сайтах, где размещаются нейрокартинки. Представьте себе, на стоковых сайтах нейрокартинок уже есть качественные изображения того, что вам нужно.

Тут скорее вам стоит сравнивать сервис Миджорни не со стоковыми сайтами, а с сайтами с онлайн-редакторами. Попробуйте сравнить любой онлайн-редактор картинок с настольным решением Adobe Photoshop - вы увидите, что все они слабее по функционалу и слишком общие (с обычными инструментами), чем Photoshop.

То же самое правило работает и с нейросетевыми сервисами и программами:

Если вы возьмёте настольное решение Stable Diffusion, то вы и тонко настроить сможете саму программу для ваших задач и найти готовые "шаблоны" (они называются "моделями" в нейросетях) по вашей тематике на каком-нибудь сайте Civitai. Кроме того, SD еще и будет для вас конфиденциальнее, чем миджорни.

Если вы хотите на халяву генерировать качественные картинки, то самым мощным и точным инструментом сейчас является SD, и на него нужно немного больше времени потратить, чем на миджорни. Если вы хотите "на халяву" (в скобочках, так как миджорни, как и некоторые другие нейро-сервисы, платные) генерировать картинки почти ни с чем не разбираясь - используйте сервисы с обобщенными инструментами, аля миджорни.

И запомните - не делайте выводы о технологиях нейросетей и не вешайте ярлыки "всё плохо" на нейросети смотря только на некоторые сервисы, которые вам легкодоступны.

imhotep1985 1 окт 2023 в 09:17

За пояснение по поводу возможностей Stable Diffusion - спасибо.

И запомните - не делайте выводы о технологиях нейросетей и не вешайте ярлыки "всё плохо" на нейросети смотря только на некоторые сервисы, которые вам легкодоступны.

А это не по адресу. Никто не говорил, что всё плохо. Статья о косяках, которые выдал конкретный инструмент в ответ на конкретные промпты.

Shyryp 1 окт 2023 в 13:09

По поводу "не адресу": Я сужу по заголовку этой статьи, а он не нацелен на конкретную нейронку-сервис Миджорни и выглядит кликбейтно-хейтерно. Хотя, конечно, я видел окончание статьи.

engine9 1 окт 2023 в 22:47

Хорошо заметно что позвоночник сетка нарисовала как "невозможную фигуру", т.к. он накладывается поверх грудины, которая отсутствует на рисунке. Вот как должно быть:

dave2 30 сен 2023 в 14:59

Инструмент выбирается под задачи. Вы взяли нейросетку-художника и попросили ее выдать медицинские данные, а потом говорите "ха-ха-ха, ну тупыыыыые". Ну да, тупые. Но не нейросети.

imhotep1985 30 сен 2023 в 17:34

А есть специальные нейросетки-художники для врачей и биологов? Не встречал такие.

klopp_spb 30 сен 2023 в 19:59

Художники (не рисовальщики обложек) анатомию изучают.

imhotep1985 30 сен 2023 в 20:07

Этот комментарий относится не конкретно к Вам: заметил, что в комментах все как-то зациклились на анатомии. А ведь в биологии и медицине много всего другого. Помимо того, что в статье, я, например, просил нарисовать нейросеть амебу. Получился рой красивых медуз, червей и другой живности. Но ничего даже отдаленно напоминающего одноклеточный организм. У них как-то порой получается хотя бы узнаваемый образ, а порой - совсем не в тему.

klopp_spb 30 сен 2023 в 21:00

Ну так о чём я и говорил ниже: не что на самом деле, а что хотят видеть.

Frevv 30 сен 2023 в 16:24

По сути видение мира на уровне гуманитариев дизайнеров. Которые придумывают абсурдные концерты авто, самолётов, техники

imhotep1985 30 сен 2023 в 17:35

Согласен. Тем не менее, реально получить годные вещи, которые можно использовать.

Meklon 30 сен 2023 в 17:25

Первый копирайтер рунета с красным дипломом врача.

Повеселило)

imhotep1985 30 сен 2023 в 17:42

Ну а куда деваться, если действительно начал заниматься этим первым среди коллег? :-) Вот такие мы, врачи, разносторонние: кто научпопом и медицинским маркетингом промышляет, а кто администрированием Linux. Конечно, весело :-)

klopp_spb 30 сен 2023 в 19:50

Так это стандартно: показывать не как на самом деле, а что люди хотят видеть :-) Хотели убийцу-фороракоса? Получите картинку, иногда ещё и коленными суставами в другую сторону.

Dave_by 30 сен 2023 в 21:16

А что будет когда нейросетки в качестве исходников для обучения начнут использовать свой же бред, который уже заполнил интернет?

314159abc 30 сен 2023 в 22:20

Уже поздно об этом думать, это уже произошло

breninsul 30 сен 2023 в 23:37

Но ведь человек это и есть гуманоид....

imhotep1985 1 окт 2023 в 08:21

"Гуманоид" переводится как "человекоподобный" - обычно так говорят про инопланетян и фантастических существ, напоминающих людей. Как раз суффикс "-оид" и придает значение "-видный", "-подобный".

icq255300363 1 окт 2023 в 08:16

Где-то в рекомендациях по генерации картинок читал, что следует избегать слова "реализм", НС воспринимает его как рекомендацию нарисовать что-то реалистичное, то есть похожее на реальность. И ключевое слово здесь - "похожее". Для генерации действительно реалистичных изображений лучше использовать тэг - "фотография". Так как НС обучается на тэгах, которые оставляют люди к картинкам, то при просмотре фотографии человек вероятнее всего поставит тег - фото, а тег - реалистично будет поставлен под... Ну скажем под 3Д рендером, или под очень качественным рисунком. Это что касается МРТ аппаратов, на картинках они как раз больше на рендеры походят. Так что тут НС ориентировалась на творчество, а не на реальные фотки МРТ аппаратов.

Glamych 1 окт 2023 в 08:17

С подключением, что я могу сказать.

mocmep 1 окт 2023 в 10:57

Нейросеть опирается не на логику, а на вероятность полученную из датасета.

heart 3 окт 2023 в 19:07

"Почему дичь? Я так вижу" (Вся суть вашего заблуждения о Midjournrey в этом ответе)

Suriko8 5 окт 2023 в 06:52

Ну так нужно уметь ещё с ними вести беседу. Есть инфа по тому,как правильно составлять промт. Нейронка вам как раз показывает классическую неспособность четко формулировать ТЗ.

Я как дизайнер ржу теперь сижу, смотрю, как заказчики просят нарисовать "ну вот эту вот фигню, как чек виду в своей голове, ну в общем вы поняли"

Нет, это совсем не то, что я хотел!")))

Классика. Это не нейронки тупые и не дизайнеры, а заказчик, не умеющий больше чем в 2 слова формулировать задачу.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий