Как стать автором
Обновить

Получил доступ к Dalle-2. Вы не поверите, что может нарисовать машина… Дизайнеры больше не нужны

Время на прочтение4 мин
Количество просмотров149K
Всего голосов 181: ↑174 и ↓7+220
Комментарии817

Комментарии 817

Cпасибо, очень занимательно. Интересно что машинка выдаст на такие вот запросы:
1)chemistry, physics and biology science in connection, prospects for the future
2)carbon based lifeforms, biochemistry, universe inside us
3)laboratory of impossible concepts, protective equipment, satellite communications

А если просто «laboratory #66» что будет?

Давай что-то одно. Первое Dalle-2 видит как так =)

Хорошо, давайте вот это «human skin, bacteria interaction, quorum sensing
Предыдущеее красиво получилось. Но к теме близко наверное только последняя картинка. Дайте ее побольше размером, пожалуйста, „чтобы распечатать“ :))
*задумался про то, сколько дней бы заняли игры с Dalle-2 будь у меня свободный доступ к нему

Ты слишком абстрактные и не популярные паттерны предлагаешь, но все равно норм.

human skin, bacteria interaction, quorum sensing, digital art
human skin, bacteria interaction, quorum sensing, digital art

Пиши в телеге, там в комментариях скину 1024*1024 разрешение)



Сам играю с Dalle-2 уже три дня и не могу остановится. Могу тебя понять)

Ну слушай, не зря ж я от Дали еще со школы без ума. Красивые абстракции и ищем у ИИ, осмысленное и самому можно склепать :) С бактериями вышло красиво *сердечко*
universe inside us, digital art
universe inside us, digital art

По второму запросу тоже красота

Прекрасно, да!

Лови третий запрос =) Обрати внимание на детали. Просто вау!

laboratory of impossible concepts, protective equipment, satellite communications, digital art, digital art, cybepunk, 8k resolution, pixel art, pixar art
laboratory of impossible concepts, protective equipment, satellite communications, digital art, digital art, cybepunk, 8k resolution, pixel art, pixar art

А вот в генерации аниме Dalle-2 прям вообще хороша

anime catgirl with blue eyes, 8k resolution, digital art, pixar art, full HD
anime catgirl with blue eyes, 8k resolution, digital art, pixar art, full HD

О, а загрузи его фразой Google Pixel on table with hand over it)

Лови =)

Google Pixel on table with hand over it, digital art
Google Pixel on table with hand over it, digital art

Сто лет не заходил в аккаунт хабра. Тут я для того что бы сказать спасибо за статью.

Пожалуйста!
Вот тебе за это бонус !

anime catgirl with blue eyes, 8k resolution, digital art, pixar art, full HD, pixel art
anime catgirl with blue eyes, 8k resolution, digital art, pixar art, full HD, pixel art

О! спроси чертежи антигравитационного двигателя или вапрп двигателя в формате чертежа. Картинки хорошо, а новое устройство лучше)

Google Pixel on table with hand over it

Это Вы сейчас пытаетесь провести старый тест на понимание "она уронила карандаш на стол и сломала его"?

Кстати, on the table.

Был виден в небе змей

On a table, раз уж на то пошло.

on the table

Нет. На каком-то столе.

НЛО прилетело и опубликовало эту надпись здесь

Как тебе миньоны на чайной церемонии?

Minions Impressionism tea ceremony
Minions Impressionism tea ceremony

А ты работы ниже в комментариях еще посмотри. Вообще офигеешь =)

А что Вам мешает предоставить свободный доступ к полным изображениям? В договоре есть такой запрет?

(Кстати говоря, насколько я видел, раньше в изображениях, генерируемых нейросетями, на более высоких разрешениях количество артефактов нелинейно увеличивалось. А мелкие картинки, конечно, прекрасны!)

Мне ничего не мешает) Просто тут проще отвечать скринами сразу на все варианты. За фулами пишите в тг.

Если пропустит цензура ) Naked woman with a large bust bathes in the Martian river at sunset

Пришлось Naked заменить =) Добавил стилей. Вышло классно!

Instagram woman with a large bust bathes in the Martian river at sunset, digital art, pixel art, 8k resolution, galaxy and purple colours
Instagram woman with a large bust bathes in the Martian river at sunset, digital art, pixel art, 8k resolution, galaxy and purple colours
beatiful woman with a large bust bathes in the Martian river at sunset, oil painting, digital art
beatiful woman with a large bust bathes in the Martian river at sunset, oil painting, digital art


Заметно что ИИ к словам woman with a large bust относится очень нейтрально )))

А вас в целом не пугает вся эта ситуация ? :) (Вопрос о текущих возможностях ИИ)

Именно у меня шок. Поэтому и решил написать статью об этом =)

А где статья?

Здравствуйте, очень интересная статья, можно сгенерировать изображение по тексту: Four-eyed hellhound chained to a stone against a hellish background, super realistic 8k. Заранее спасибо.

four-eyed hellhound chained to a rock against a hellish background, super realistic 8k, digital art
four-eyed hellhound chained to a rock against a hellish background, super realistic 8k, digital art

Забий своих гончих из ада =)

Интересно, не известные слова, Dalle просто игнорируются или же каким-то образом влияют на результат. Пока предполагаю? что игнорируются, ни у одного бобика не вижу четырех глаз.

Поздравляю, вы похоже обнаружили ещё один недостаток этой нейронки: она не умеет считать. Запросы вида «six apples on the table» или «figure with seven corners» выполняются из рук вон плохо.
Неизвестные слова нейронка отрабатывает по ассоциативным цепочкам. Можно скормить бессмысленный запрос типа «wabbus shibubius, fantasy art» и всё равно получить картинку, причём на картинках будет изображено примерно одно и то же.

Да кажется так. Нейронка не смогла нарисовать пса с четырьмя глазами.

У Кандинского может получиться лучше: в русскоязычной среде понятие четырёхглазых собак есть (это которые с пятнышками-ложными глазами для введения врага в заблуждение).
в русскоязычной среде понятие четырёхглазых собак есть


Кстати, а как нейронка переварит такое известное понятие, как Three Dog Night? :)
Я пожалуй даже обобщу, как искать подобные недостатки: там где естественным нейронками приходится напрягаться, там и искусственным сложно.

Счёту дети сами не учатся, их приходится этому учить. Долго у людей было, по всей видимости, только «один, два, много» — что и для нейронок проще.

Надо научиться лучше писать запрос. Конечно не четырёхглазая адская гончая но все равно результат хорош, большое спасибо. Кстати, а как можно получить доступ к API Dalle-2?

В точности как при социализме — встать в очередь и очень долго ждать. Доступ выдают примерно 1000 новым пользователям в неделю. С учётом длины очереди прождать можно несколько месяцев.

Сделай их злее пожалуйста ?

Привет. Можно и мне? Terminator T800 with battle damage to the skin ominously looks at us. The flesh rots and decays. Photorealistic, dark photo against the background of a machine-building plant.

У меня у одного не получается оттуда доставать вменяемые картинки?

Если бы у всех был доступ, нас бы было много.

Плохо стараешься) Можно легко скачивать оригиналы.

Дизайнеры больше не нужны


Уже довольно давно в MS PowerPoint появилась функция автоматической генерации графического оформления слайдов.
Первая реакция — восторг, как в статье.

Но потом она слегка задолбала своим разнообразным однообразием (легальный 365) — у человека фантазия намного разнообразнее и осмысленнее, чем у ИИ.

Но Dalle-2 каждый раз что-то уникальное генерирует. Иногда варианты отличаются очень сильное. При этом сущности из текста все равно хорошо сохраняются.

Но Dalle-2 каждый раз что-то уникальное генерирует.


Да, как и прибор под названием «калейдоскоп».
Но все равно — это всего лишь перетасовка определенного набора изображений, бессмысленная и беспощадная :)

Примерно тот же принцип, но со смыслом
image

Разве дизайнеры это не тот же самый калейдоскоп ?) Все мы сшиты из мыслей и слов, которые слышали ранее.

Разве дизайнеры это не тот же самый калейдоскоп ?)


Нет
Берем ноут ASUS A6Q00Vm (A6Vm-P745S58HWW) 2006 года и сравниваем его с MacBook Pro 13″ A1278 Mid 2009 ((Unibody)

Compare ASUS A6Q00Vm laptop from 2006 with Macbook Pro 13" A1278 Mid 2009 (unibody)

@Aleron75, тут запрос для Dalle :)

Ахах, ну ловите!

Берем ноут ASUS A6Q00Vm (A6Vm-P745S58HWW) 2006 года и сравниваем его с MacBook Pro 13″ A1278 Mid 2009 ((Unibody), digital art, cyberpunk style
Берем ноут ASUS A6Q00Vm (A6Vm-P745S58HWW) 2006 года и сравниваем его с MacBook Pro 13″ A1278 Mid 2009 ((Unibody), digital art, cyberpunk style

Последнее, словно в душу смотрит)

Примеривается, как лучше туда плюнуть ;)

Если сшить голема из слов, он всё равно останется големом без намерений, который неспособен назначать и воспроизводить смыслы.

НЛО прилетело и опубликовало эту надпись здесь

А есть какое-то подтверждение, что живой человек способен назначать и воспроизводить смыслы? Какое-то вот надёжное, что бы взять две картинки и точно понять - в одной есть смысл, в другой нет. Или на веру всё?

Боже, ахах. Так пусть псевдоинтеллект и стряпает человечеству макеты сложных интефейсов. Тут даже на счет художников то поспорить можно...

Ой, а расскажите мне про смысл этой картинки? А то от меня убегает...

На примере городов будущего Dalle-2 генерирует только небоскребы. Другие варианты не рассматривабтся вообще.

НЛО прилетело и опубликовало эту надпись здесь

В том то и проблема, что нужно придумать что мы хотим, а нам уже отрисуют. При этом нужно достаточно подробно описать что нам нужно, сгенерировать разные результаты из одного запроса Dalle 2, кажется, не может (что вполне логично, нет?). По сути, Dalle 2 это не дизайнер и не художник, а просто кисть для дизайнера или художника.

НЛО прилетело и опубликовало эту надпись здесь
А как должно быть? Система должна догадаться чего вы хотите увидеть и нарисовать это?
Бинго! Основная проблема с заказчиками чего угодно (рисунков, софта, музыки) заключается в том, что они обычно сами не знают, чего хотят. И уж тем более не способны внятно выразить свои мысли, лишь разводя руками и издавая странные мычащие звуки.
Нарисовать, написать и закодить не так сложно, это уже рутина. Основная сложность заключается в том, чтобы вытащить смутные расплывчатые желания из головы заказчика и превратить их в техзадание.
НЛО прилетело и опубликовало эту надпись здесь

Если мы говорим о системе, как о замене художников и дизайнеров, то да, система должна сама догадаться. Например, говоришь, нарисуй мне город будущего, а Dalle 2 выдает пару небоскребов. А тебе не нужны небоскребы, тебе нужен город будущего.
Художник же может выдать кучу разных вариантов городов будущего из головы, может присовокупить к ним летающий паровоз или сцену четвертой мировой войны с камнями и палками. Поэтому человек может догадаться что тебе нужно, даже если ты этого сам не знаешь. А для Dalle 2 нужно составиться максимально конкретное ТЗ. Получается, что сначала у себя в голове нужно что-то "нарисовать", а потом просто перевести эту картинку в графический вид. Раньше для этого нужны были навыки и кисти, а теперь можно просто текстом.

НЛО прилетело и опубликовало эту надпись здесь

«Извините, я сказал город будущего, а не москва-сити.» Или как нужно реагировать на художника, которому надо каждый штрих на рисунке проговаривать?

Мы говорим об одном и том же.

Мне кажется, что это хороший вариант для составления ТЗ. А потом уж пусть дизайнер работает

НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь

Запихнул все в один запрос. Классно вышло?

futuristic mansions city without skyscrapers, futuristic suburban area without skyscrapers, futuristic five-stored houses city without skyscrapers, futuristic three-stored houses city without skyscrapers, futuristic underground city without skyscrapers, futuristic balloons as houses city without skyscrapers, futuristic houses on trees city without skyscrapers, futuristic biologic hous, digital art
futuristic mansions city without skyscrapers, futuristic suburban area without skyscrapers, futuristic five-stored houses city without skyscrapers, futuristic three-stored houses city without skyscrapers, futuristic underground city without skyscrapers, futuristic balloons as houses city without skyscrapers, futuristic houses on trees city without skyscrapers, futuristic biologic hous, digital art

НЛО прилетело и опубликовало эту надпись здесь

А как тебе пиксельный Дубай?

Dubai, Real estate, desert, digital art, cybepunk, 8k resolution, pixel art, pixar art
Dubai, Real estate, desert, digital art, cybepunk, 8k resolution, pixel art, pixar art

Здравствуйте очень интересная статья, можно мне сгенерировать по запросу: Moscow calling

Так небоскрёбы же остались по сути — длинные высокие сооружения.
НЛО прилетело и опубликовало эту надпись здесь

Приблизительно так я и представлял полученные результаты, от Dalle. Единственный вариант, что меня удивил - это третий. Остальные варианты, явно популярны среди современных художников, что и будет сказываться на результатах Dalle. Как говорится на чем обучили, то и получили. Но даже при этом результаты поражают.

В вашей же статье все сгенерированные роботы примерно одинаковые. Незначительные отличия только в голове и использовано 3 разных цвета…
НЛО прилетело и опубликовало эту надпись здесь

Привет)

Когда можно будет получить в цепкие лапы Dalle-2?

Прогони вот это пожалуйста (очень надо):

psyhodelic mashroom heterosexual, among us, lsd art, oil painting, little creepy faces faces background

Уххх, какая-то психоделика...

psyhodelic mashroom heterosexual, among us, lsd art, oil painting, little creepy faces faces background, digital art, cyberpunk style
psyhodelic mashroom heterosexual, among us, lsd art, oil painting, little creepy faces faces background, digital art, cyberpunk style

psyhodelic mashroom
Уххх, какая-то психоделика...

Уж сколько раз твердили миру, что если просто транслитерировать слово, которое не знаешь, латинскими буквами, то получится совсем не то, что хотел, а psychedelic mushroom пишется совсем не так.

Но Ваша внутричерепная нейросетка с лёгкостью догадалась же, что имелось в виду? Вот и Dall-e 2 догадалась аналогично.

Как раз в подобных случаях подобные опечатки имеют не слишком большое значение. «Psycho» гораздо дальше от «psyhodelic», чем «psychedelic», и поэтому на картинке не отразилось, на мой взгляд, совсем.

Восхитительно — то есть когда компьютерная нейросетка совершает те же грамматические ошибки, что и биологическая — это замечательно и вообще, а когда компьютерная нейросетка делает те же ошибки в оценках, что и биологическая, то её надо "усыпить" за расизм и неполлиткоректность?

Простите, Вы сами с собой сейчас поговорили? :) Выглядит, будто Вы критикуете что-то написанное в моём сообщении, но при этом Ваше рассуждение не имеет с ним связи. Может, вы что-то недостаточно внимательно прочитали?

ИНС в контексте нашей дискуссии не делают никаких грамматических/орфорграфических ошибок — речь о том, что ИНС устойчивы к совершению людьми таких ошибок в запросах, и дают на них практически такой же ответ, как и на запрос без ошибки.

Простите, Вы сами с собой сейчас поговорили?

Не прощу :) Я сейчас ни с кем не говорил, а высказался в духе "и эти люди запрещают мне нейросети ковырять в носу обижать негров евреев"

Потому что это не ИИ и фантазии у него нет :) Любой из предложенных Dalle вариантов, это поиск в уже известных образах и усреднение с долей рандома (что и создаёт эффект однообразия — «лучшие» варианты будут похожи). Тоесть, строго говоря, именно «креативности» там нет вообще, а весь эффект, это лишь способность «склеить» неподходящие образы каким-то образом и «узнавание» образов. ML в данный момент может стать ассистентом с неплохим кругозором, но не дизайнером.

ну так это именно то что надо в 99% случаев

ну так это именно то что надо в 99% случаев


Ну и будет в итоге как с современной музыкой.
Современная музыка в совершенстве воплотила главное свойство музыки — товарность, способность продаваться.

Если от дизайна требуется товарность, программный генератор будет работать лучше человека.

Если же от дизайна требуется художественная выразительность и творческое мастерство (а вовсе не прибыльная товарность), то я хотел бы узнать город, в котором это требуется. Я туда уеду, чтобы не платить.
Современная музыка в совершенстве воплотила главное свойство музыки — товарность, способность продаваться.


Гм. В моем детстве родители пачками покупали пластинки (еще на 78 оборотов).
Когда я вырос, стал покупать пластинки сам (даже жена не смогла пресечь это увлечение :), доведя коллекцию до 400 шт.
Потом пришлось покупать CD.
(Еще потом вернулся винил :)
Где-то в промежутке покупал через Эппл старые альбомы, записи с которых слушал в юности на магнитофонах — чисто, чтобы вернуть старые долги.

Сейчас не покупаю ничего. Так как все старое у меня уже есть, а все новое — абсолютно не интересно.

Люди все больше слушают «старую» музыку, ту, что выпущена более полутора лет назад. Тенденция к «старению» треков продолжается уже 3 года, ранее такого не замечалось. Наибольшая популярность сейчас у треков, вышедших в 2017–2019 годах.

via https://t.me/addmeto/4980

Люди все больше слушают «старую» музыку, ту, что выпущена более полутора лет назад.


Простой анализ этого видео:

Заголовок спойлера



показывает, что проблемы начались где-то с конца 80х, а с середины 2000х — можно сказать, что с поп-музыкой уже все.

Эм, ну почему всё? Просто современной музыки стало очень много. Искать действительно хорошую стало труднее.

Искать действительно хорошую стало труднее.


В представленном видео показан топчик по годам.
Т.е. отбор уже произведен.
показывает, что проблемы начались где-то с конца 80х, а с середины 2000х — можно сказать, что с поп-музыкой уже все.
В примере сначала довольно унылая и откровенно старая по звучанию музыка с редкими интересными (до сих пор) треками, а потом ближе к нашему времени пободрее. Что сильно бросается в глаза уши — это изменяющаяся электроника и аранжировка, в этом по большей части и отличие.
В примере сначала довольно унылая и откровенно старая по звучанию музыка


Непривычная для вашего уха аранжировка. Послушайте ремиксы, они, конечно, есть.

а потом ближе к нашему времени пободрее.


Это диско, да? :)

Что сильно бросается в глаза уши — это изменяющаяся электроника и аранжировка, в этом по большей части и отличие.


Что бросается прямо в уши — так это прямое отсутствие новых мелодий в последние годы.

Как сказал один из моих юных падаванов, слушая какой-то альбом из старых — «Ничего себе! Тут каждая композиция — хит!».
Непривычная для вашего уха аранжировка. Послушайте ремиксы, они, конечно, есть.
Это же не академическая музыка и даже не прогрессив какой. Примитивная (и популярная) музыка аранжировкой, украшательствами и подобным и заметно отличается уже лет сто как минимум, нанизываясь на малопримечательные мотивы.
прямое отсутствие новых мелодий в последние годы.
Понять бы, что вы имеете ввиду под мелодией. Плагиат в новой музыке относительно известен и даже иногда скандален, но случалось это и в 1970-х — тогда заимствовали условно из 1930-х, о которых мы мало что знаем. В 2050-х, думаю, тоже на Бейонсе будут смотреть как на что-то оригинальное, откуда всё пошло. Но плагиат относительно редок.
Понять бы, что вы имеете ввиду под мелодией.


Вот это самое, что вы слышите на этом видео:


А теперь, пожалуйста, что-то подобное из современного.

"Сплин" например. Многим нравится. Хотя, если нужно именно 2022 года.. Хотя, сравнивать всю историю музыки, и момент "вот прямо сейчас", то конечно да, всё лучшее было в прошлом.

Хотя, если нужно именно 2022 года..


Хотя бы за последние 10 лет.

https://www.youtube.com/watch?v=NT9GFoRbnfc

https://youtu.be/cCPv24nvUh8

https://youtu.be/pHNyM0dlKyA

https://youtu.be/nM8CWySnAs8

https://youtu.be/kG46IzgdB0Y

Просто нужно поискать, и конечно проблема еще в том, что такие мелодичные песни сложно использовать. Крутить их в ТЦ или на диско или в кафе неудобно - они слишком отвлекают, а значит их монетизация - только просмотры и концерты.

youtu.be/kG46IzgdB0Y


Тина Кароль поет хорошо, факт, но мелодии все вторичные (точнее -десятиричные :) и в силу этого, навевающие скуку (хотя для людей, слышавших не так много музыки, вполне сойдет)

значит их монетизация — только просмотры и концерты.


Любая хорошая мелодия мгновенно уходит в массы, причем не обязательно в оригинальном исполнении.

Тина Кароль поет хорошо, факт, но мелодии все вторичные (точнее -десятиричные :) и в силу этого, навевающие скуку (хотя для людей, слышавших не так много музыки, вполне сойдет)

Все, что ВЫ слышали - тоже частично вторично. Но вопрос был не в этом. Вопрос был в том, что в современной популярной музыке полно мелодичных композиций разного жанра. Просто нужно брать и искать, а не слушать то, что подкидывают топ-чарты местных ТРЦ и радио

Вопрос был в том, что в современной популярной музыке полно мелодичных композиций разного жанра.


Увы, никто из оппонентов так и не представил ни одной современной и интересной мелодичной композиции любого жанра.
Хотя из «старенького» их можно выдавать целыми альбомами, не особо утруждая себя поиском.
неужели скажете что вторично и скучно? ;)


Конечно. В оригинале — модный некогда реп, реализованный в данном случае в виде дамского речитатива + совсем немного готовых сэмплов.

(не смотрите видео, когда оцениваете музыку — так лучше слышно :)

А вот пример действительно интересной мелодии на ту же букву А:

Заголовок спойлера

что в ней интересного, кроме того, что вы ее с детства знаете?

что в ней интересного, кроме того, что вы ее с детства знаете?

Abracadabra (Steve Miller Band song)

если честно я не понял ваш ответ. песня интересна тем, что про нее в википедии написано?

если честно я не понял ваш ответ. песня интересна тем, что про нее в википедии написано?


Там написано, насколько она была популярна в мире.
См.

а.. так критерий интересности песни - ее популярность? Тогда вопросов нет - сейчас навалом интересных песен, просто открываем любой топ-100

Но тогда ваш изначальный комментарий

Ну и будет в итоге как с современной музыкой.

теряет смысл, т.к. популярных (а значит интересных) песен и сейчас много, а значит с современной музыкой всё в порядке

а… так критерий интересности песни — ее популярность?


Нет, это просто количественная оценка данного произведения.
Поскольку «интересность» — для разных людей выражается по разному. А тут явный элемент объективности — оказалось интересным многим.

сейчас навалом интересных песен, просто открываем любой топ-100


«На безрыбье — и рак рыба» (с)

Нет, это просто количественная оценка

Никаких других не приведено, а опираться на что-то надо. Но я понял - остальное лежит в плоскости "мне просто нравится", а что мне не нравится - полный шлак и деграднутость.

«На безрыбье — и рак рыба» (с)

нет никакого безрыбья. записи битлов, диперпл и абракадабра - никуда не исчезли, можно слушать бесконечно. но люди слушают что-то другое, потому что этого другого бесконечно много, и классной и хорошей музыки там тоже полно. Так что скорее тут именно ваше личное, чисто субъективное, безрыбье ;)

Где-то так. Вполне себе современная попса. Тут дело в том, что из-за легкости доставки и публикации один толстый поток универсально-узнаваемых и популярных мелодий разбился на множество ручейков.

Но даже если нужно универсально-узнаваемо, то есть Gungnam Style какой-нибудь. С моей точки зрения, правда - привлекательность сомнительна, но количество просмотров с этим не согласно.

Где-то так.


Простите, но это такой же микс, как и сабжевые картинки.

о есть Gungnam Style какой-нибудь.


Увы, даже Gungnam Style был уже очень давно.
(можно сказать — последний всемирный хит :)

Простите, но это такой же микс, как и сабжевые картинки.

Тогда имеем "парадокс кучи" т.е. с какого момента сочетание звуков (а гармоничных и приятных для слуха, как я понимаю, не так уж и много) становится оригинальным, а не миксом.

Что-нибудь такое -- это еще микс или уже нет?

Что-нибудь такое


Это аранжировки. В данном случае — мягко говоря, очень упрощенные, под плохую танцевальную музыку.

Вот тоже аранжировка классики, но сделанная куда лучше.

Заголовок спойлера



Тогда имеем «парадокс кучи» т.е. с какого момента сочетание звуков (а гармоничных и приятных для слуха, как я понимаю, не так уж и много) становится оригинальным, а не миксом


С того момента, когда большинство людей (не только сами музыканты) начинают четко отличать одну мелодию от другой, и при отсутствии при этом плагиата :)

«В голове мильон мелодий — только жаль, что не своих» (с)
Вы это называете оригинальной музыкой? Отлично перекликается с каким-нибудь русским романсом начала прошлого века, наверняка можно найти местные «источники» и для этой песни. Более того, отдельные отрывки как из некоторой простой музыки барокко, ну ладно.
Что вы подразумеваете под «подобным»? Это или это (поп-группы, которые я легко могу вспомнить) — считается «подобным»? Ничего особенного (как и в проигрышах Beetles), из более сложного я могу привести Ayreon, который менее популярен, но с ним никакие из ваших примеров не могут равняться. Rammstein вот суперпопулярен, он пройдёт как подобное?)
наверняка можно найти «источники» и для этой песни.


Найдите :)

Это или это (поп-группы, которые я легко могу вспомнить)


Тут у вас одна ссылка дана дважды.
(Океан Ельзи — хорошая группа, но пример крайне неудачный)
Кстати, вот возможный источник идеи, полностью оригинальный, и, увы, очень старый.

Ayreon


Это оно? Так тут с первых аккордов чуть ли не мотив Hell Marsh из RA проскальзывает (а чуть дальше мелкие кусочки из темы Миссии невыполнима :)

Похоже, что вся новая музыка слеплена из миниатюрных кусочков (сэмплов) каждый из которых уже где-то был использован ранее.
Так тут с первых аккордов чуть ли не мотив Hell Marsh из RA проскальзывает (а чуть дальше мелкие кусочки из темы Миссии невыполнима :)
У вас довольно необычный слух, я думаю, очень легко ловит схожести. В приведённом треке Ayreon во вступлении ведующая серия из 4 нот, отрывисто проигрываемых на гитаре, что стилистически похоже на Hell Marsh, что вы, видимо, и поймали. Их можно настучать на столе. Попробуйте включить Hell Marsh и настучать эти 4 ноты, их там нет. Потом, как я понимаю, 2 ноты на трубах вы распознали как 3 ноты из миссии невыполнимы (из 5, размер известного трека — 5/4).
С такой точностью распознавания плагиата вы и вправду не услышите никакой новой музыки примерно никогда. Вон даже варьирующий прогрессив разбили на кусочки и что-то знакомое услышали. Но чтобы считаться заимствованием в музыкальном мире, по-моему, нужно что-то существенно большее, поэтому никому со стороны вы ничего не докажете, кроме уже с вами согласных олдфагов и их падаванов.
Найдите
В силу отсутствия такого «таланта» мне придётся потратить слишком много времени.
Но чтобы считаться заимствованием в музыкальном мире,


Как можно заметить, о прямом плагиате у меня речи не идет, я бы привел другой пример :)

С учетом специфики ресурса



А это оригинал

Ладно. Скажите лучше, на чем вы именно настаиваете? Что вероятнее: что по несколько нот в одном размере во все времена совпадали в разной музыке, или что сотни лет придумывались и распространялись оригинальные мелодии, но вдруг в вашем зрелом возрасте с человечеством что-то случилось и его заело на одном и том же? Какая у вас модель музыкального мира?
, но вдруг в вашем зрелом возрасте с человечеством что-то случилось и его заело на одном и том же?


Именно! Заело после начала массового применения компьютеров для создания музыки (я тут не причем :)

Максимально запростецкая песня... да и вообще вся эта современная музыка, битлы ваши, зепеллины и дипперплы после Моцарта, Бетховена и Чайковского и музыкантами то считаться не должны /s

после Моцарта, Бетховена и Чайковского


Родись Моцарт, Бетховен и Чайковский в наше время — писали бы музыку для поп и рок групп.

Заголовок спойлера



(по поводу Моцарта — и тени сомнения нет :)

Родись Моцарт, Бетховен и Чайковский в наше время — писали бы музыку для поп и рок групп.

История не сослагательна. Не родись они в то время когда родились может и не было бы ни рок ни поп-музыки. Суть не меняется - на фоне классиков диперплы с музыкальной точки зрения кажутся жалкими посмешищами. Но это не значит что они плохи. Если музыка кому то нравится - это прекрасно. Если она нравится многим - это еще прекраснее. И в этом смысле Бритни Спирс или например Билли Айлиш тоже ничем хуже Deep Purple - у них тоже прекрасная музыка

Сойдёт или вторично?


"… Раньше условный сингер-сонграйтер сидел с гитарой дни напролет и, страдая, выжимал из себя материал. Сейчас все намного проще.
Артист берет сэмпл, заливает его в какой-нибудь Ableton или Fruity Loops, накидывает сверху трещоток, басов, и все — новый хит готов" (с)

Да раньше и Солнце ярче светило!

НЛО прилетело и опубликовало эту надпись здесь
Сейчас не покупаю ничего. Так как все старое у меня уже есть, а все новое — абсолютно не интересно.
Вы в молодости не общались с людьми постарше, которые любили старую музыку, а современную (на то время) игнорировали?
Вы в молодости не общались с людьми постарше, которые любили старую музыку, а современную (на то время) игнорировали?


Старшее для нас поколение (это 30х годов рождения) танцевало буги-вуги и рок-н-ролл, и ностальгировало, слушая монолог из пьесы «Взрослая дочь молодого человека»

1980 г.



А поколение 50х просвещало нас насчет Битлов и Зе Ху :)

А что не так с "современной музыкой"? Или претензии к какому-то конкретному жанру? Или даже к отдельным композициям?

А что не так с «современной музыкой»?


Просто сравниваем количество оригинальных музыкальных идей в поп- музыке тогда и сейчас:
Заголовок спойлера



С рок-музыкой аналогично, классика вообще в…
Как тогда было полно шаблонов, так и сейчас встречаются бриллианты.
Как тогда было полно шаблонов, так и сейчас встречаются бриллианты.


Ищу такие бриллианты. Поделитесь.

И со мной, пожалуйста.

Чтобы песня рассказывала историю, а не "бымц бымц банька моя я твой тазик бымц бымц".

Slice The Cake - Odyssey to the West

Slice The Cake — Odyssey to the West


Это не бриллиант. В наше время подобное называлось «Похороны клопа» :)

Сравните с



Прим. Эту композицию (в нормальном качестве) я обычно использую как эталонную для проверки звуковоспроизводящей аппаратуры — тут саунд настолько сложный, что все недостатки слышны как на ладони.

Если коротко все это дело вкуса. Если подробней, человеку будет нравится, то на чем сформировался его мозг, после уже трудно изменить вкусы и предпочтения данного человека. Потому и возникает непонимание "Отцов и детей". Вы не будете замечать или понимать того, что именно нравится новому поколению в музыке. Просмотрев видео, что Вы выше в спойлере предоставили про количество оригинальных музыкальных идей в поп- музыке, у меня вызвали положительные эмоции только те треки, которые вызывали те же положительные эмоции в детстве и юношестве. К примеру тот же "Smoke on the water" я бы так же отнес к не интересной и скучной, думаю, это из-за того, что я не увлекался данной группой или схожей по стилистике музыкой той эпохи. Старые композиции как и современные у меня не вызывают положительных эмоций или восхищения "о какая мелодия, такая сложная и потрясающая". Все выше написанное моё личное мнение, ни на чем не настаиваю.

Если подробней, человеку будет нравится, то на чем сформировался его мозг, после уже трудно изменить вкусы и предпочтения данного человека.


В детстве я слушал музыку в стиле А. Островского (см.)
В юности — советскую эстраду (т.н. ВИА)
В студенческие годы — диско.
Потом полюбил классику.
Сейчас я слушаю в основном джаз.

И все что я слушал — мне нравится и сейчас. Хотя вкусы менялись постоянно.

Вы не будете замечать или понимать того, что именно нравится новому поколению в музыке.


Мои дети, мои племянники и племянницы — к современной музыке абсолютно равнодушны (к классике и джазу, к сожалению — тоже).
Более того — у них нет ни малейшей тяги к тому, что бы слушать музыку своей молодости (это 90-тые годы).
(Скорее, это я буду ее слушать, чем они :)

Тут уже третье поколение готово выйти во взрослую жизнь (со специальностями компьютерная и программная инженерия и проч.) — к музыке же вообще интереса ноль.

Дело не в людях, дело в самой музыке.
Музыка есть вечная, а есть проходящая. Бах до сих пор не потерял ценности и регулярно исполняется, а по сложности без ущерба музыкальности ему по прежнему нет даже близких, не то что равных композиторов. Джаз тоже играется часто и многими, но джазовые стандарты давно уже не пополняются. Pink Floyd по концептуальной, музыкальной и звукорежиссёрской целостности альбомов тоже никто не смог превзойти. Развитие электронной музыки тоже прошло пик — и «Children» Роберта Майлса осталась непревзойдённой иконой. А другая популярная электронная тема, не потерявшая актуальности — внезапно является темой Эдуарда Артемьева из фильма 40-летней давности, и буквально вчера мне попалось видео на ютубе, где молоденькая девочка объясняла как её играть на синтезаторе.

Так что да, всё дело в музыке.

Вы совершенно не правильно поняли мой текст. Я считаю так. Пока идет бурное развитие мозга Ваши вкусы могут меняться сколь угодно раз и вам будет нравится, то одно, то другое. А вот ближе к старости наш мозг уже не готов так активно меняться и может воспринимать, что то новое как, что то бездарное и плохое, а вот раньше было лучше. Заметьте, чем старее мы, тем ворчливее становимся. Вот об этом я и писал. Причем положительное подкрепление никто не отменял, услышав что то, что вам нравилось в детстве, так скажем из-за ассоциативным ностальгирующих моментов, вызовет все же положительные эмоции, не желе никаких. На любовь к тем или иным вещам очень сильно влияет окружение, к примеру: семья, школа, какой-нибудь признанный этим человеком авторитет (при чем чем больше авторитет у влияющего тем больше вероятность полюбить именно то что он пропагандирует), а не то, что это современно или же ретро. Так же человек может идти в разрез с обществом пытаясь, что то доказать, тем самым сформировав своё виденье(гнуть свою линию, меня никто не понимает, я уникален и т.п.), но обычно его что то должно было к этому подтолкнуть из того же окружения. Короче я тут могу долго философствовать и фантазировать, писать всякие глупости. Чем больше человек уверен в своих словах, тем больше бреда он может извергнуть.

А вот ближе к старости наш мозг уже не готов так активно меняться и может воспринимать, что то новое как, что то бездарное и плохое, а вот раньше было лучше.


Вопрос — что такое старость и когда она начинается?
Ответ — это понятие не зависит от возраста, и присуще каждому человеку индивидуально.

Кто-то стал стариком в 25 и спился к 35 (смерть желаний и потеря жажды жизни), кто-то и в 75 дает фору молодым (как один мой знакомый профессор, в 75 лет самостоятельно освоивший компьютер (это было в 1998) на уровне продвинутого пользователя.

(конечно, с физическим здоровьем дела обстоят хуже, но мы не об этом параметре молодости :)

На любовь к тем или иным вещам очень сильно влияет окружение, к примеру: семья, школа, какой-нибудь признанный этим человеком авторитет


Гм. По данному предмету (музыке) дело обстояло с точностью до наоборот — любовь к зарубежной музыке (а к року — особенно) категорически не приветствовалась тогдашними авторитетами и школой особенно (см. фильм «Розыгрыш» (1977), там все сильно смягчено, но показано правильно :)
А в семьях детей отдавали в музыкальные школы, где опять же, зарубежная попса и рок категорически не приветствовались.

Так что не благодаря — а вопреки :)

>>Если подробней, человеку будет нравится, то на чем сформировался его мозг, после уже трудно изменить вкусы и предпочтения данного человека.

ммм.... Всё детство слушал попсу с музтв и рэп, много рэпа, очень очень много рэпа. А ещё слушал чёрный рэп, не так много, но много. Я уже говорил, что слушал рэп? Слушал, да, и наизусть знал кучу треков, и до сих пор помню отдельные куплеты.

В 17 лет таки мне очень сильно зашли треки Fallout 3, и в моём плейлисте прописалось много музыки тех бородатых годов. В душе не знаю как она называется, но очень нравится.

В 19-20 лет, 2 года на повторе крутились ТОЛЬКО все альбомы Флёр. Только они, и больше ничего, 2 года. На столько мне зашло.

В 20 лет внутри аниме играли классические музыкальные композиции с концертов. Тогда у меня пропало отвращение к классике, а Рахманинов занял почётное место в сердечке.

В 25 лет, впервые смотря ДжоДжо, мне очень не нравилась открывающая композиция, потому что она была роком. Не тяжёлым, обычным. Сейчас, спустя 4 года, спокойно её слушаю, и за эти 4 года вообще в плейлист попало крайне много рок-композиций, в том числе старых, с печальным качеством. Smoke on the water - одна из них. Рок заходил в мою жизнь тяжело и со скрипом, но по итогу зашёл и обосновался основательно. Да, пару лет познакомился с Девидом Боуи. Отвал башки, как говорится.

Сейчас почти 30, а реп я с 20 лет(примерно) вообще не слушаю. То что нравилось раньше из репа - теперь не могу включать, воротит. Буквально несколько треков сос мыслом осталось в душе, иногда их включаю, но редко. Хотя, справедливости ради, за эти 10 лет таки нашлись-таки целых три трека, которые попали в мой плейлист, но это исключение.

Сейчас слушаю J-pop, J-rock, и вернулся к Флёр.

Короче говоря: теория классная, только жаль, что не работает.

Ну моя теория еще не опровергнута, 30 это еще не старость. Но то, что она шаткая, я согласен. Я сужу по себе и своему отцу. Видимо моё виденье узкое. А статистических данных уж точно у меня мало.

То что нравилось раньше из репа — теперь не могу включать, воротит.


Попробуйте это:
Заголовок спойлера


(Да, как ни странно — это тоже реп :)

Хмм, всё что я смог найти:

"Похороны клопа" - ритуал разных народов по изгнанию из домов насекомых-паразитов.

Понятия не имею как это вообще относится к музыке и к поиску "бриллиантов". Если проясните - буду благодарен. Мне очень интересно.

На самом деле, я отвечал больше не вам, а Wesha, т.к. он предоставил, скажем так, более конкретное ТЗ. А вот что такое "бриллианты" в вашем понимании для меня загадка т.к. приведённая вами в пример песня одного риффа лично у меня никаких ассоциаций кроме как с новичками в магазине гитар не вызывает)

Понятия не имею как это вообще относится к музыке


«Похороны клопа» — старый мем, обозначавший попытки самодеятельного музыканта публично импровизировать на гитаре, электрооргане, пианино и проч. музыкальных инструментах, опираясь по памяти на ранее услышанное.

Получалось довольно тоскливо, отсюда и «похороны» :)

(есть аналог для вокала — «что вижу, о том и пою»)

Похороны клопа-отличный запрос для Dalle2!

Ну справедливости ради у битлов тексты тоже весьма незамысловаты: я встретил ее, она сказала что любит тебя, еееее)

Ну справедливости ради у битлов тексты тоже весьма незамысловаты: я встретил ее, она сказала что любит тебя, еееее)


Заголовок спойлера
When I find myself in times of trouble
Mother Mary comes to me
Speaking words of wisdom
Let it be
And in my hour of darkness
She is standing right in front of me
Speaking words of wisdom
Let it be
Let is be, let it be
Let it be, let it be
Whisper words of wisdom
Let it be
And when the brokenhearted people
Living in the world agree
There will be an answer
Let it be
For though they may be parted
There is still a chance that they will see
There will be an answer
Let it be
Let is be, let it be
Let it be, let it be
Yeah, there will be an answer
Let it be
Let is be, let it be
Let it be, let it be
Whisper words of wisdom
Let it be
Let is be, let it be
Let it be, yeah, let it be
Whisper words of wisdom
Let it be
And when the night is cloudy
There is still a light that shines on me
Shine on 'til tomorrow
Let it be
I wake up to the sound of music
Mother Mary comes to me
Speaking words of wisdom
Let it be, yeah
Let it be, let it be
Let it be, yeah, let it be
Oh, there will be an answer
Let it be
Let it be, let it be
Let it be, yeah, let it be
Whisper words of wisdom
Let it be

у поздних битлов да, тексты стали глубже, но популярность они набрали на текстах типа:

You think you’ve lost your love

Well, I saw her yesterday

It’s you she thinking of

And she told me what to say

She says she loves you

And you know that cant be bad…

или:

Love love me do

You know i love you

I’ll always be true

So please love me do

но популярность они набрали на текстах типа:


На тот момент их фанатами были преимущественно экзальтированные девчонки, (см. видео того периода :)

Я, благодаря своим старшим двоюродным братьям, с их магнитофоном Днепр — познакомился с творчеством битлов еще в дошкольный период, и первый их хит, который помню — «Eleanor Rigby» (запись дошла до нас в 1967).

А с ранним периодом творчества Битлз я познакомился много позже — где-то в начале 80х (хотя инструментальные аранжировки слышал и раньше).

Я с творчеством битлов знакомилась в том порядке в котором они набирали популярность) мое знакомство происходило в 90-е когда вышел фильм the beatles anthology или как-то так он назывался)

Смотрела фильм вместе с бабушкой) под ее постоянное ворчание - о боже, патлатые какие и орут, вот другое дело Александр Малинин ?

На мой недоуменный вопрос - он же еще более патлатый? Ответом всегда было - нееее, ну это другооое))

Александр Малинин


1958 г. рождения, да еще и музыкант с детства.

Наверняка битломан, в свое время :)
И длинные волосы — как дань памяти и уважения.

Как раз вчера слушал кантри на Spotify, и обратил внимание на эту песню:
https://www.musixmatch.com/lyrics/Braxton-Keith-2/Cold-Hard-Steel-and-Sand
По-моему, очень годно: про историю Техаса
Сразу вспомнил, когда читал эту ветку комментариев

Crush 40 - One of those days

Luna Sea - Feel

The HU - Yuve Yuve Yu
The HU - The Great Chinggis Khaan

Crush 40 - One of those days

Luna Sea - Feel

Это или снобизм, или брюзжание. Мне как-то удаётся найти что-то интересное для себя. В приведённом видео только хиты из Billboard, за его рамками огромное количество музыки, о которой мы даже никогда можем и не узнать

Это или снобизм, или брюзжание.


Похоже, что для вас есть только два мнения :)

Мне как-то удаётся найти что-то интересное для себя.


Я за свою жизнь переслушал уже столько музыки, что, похоже, таки нашел практически все, что заслуживает внимания :) Увы, нынешнее новое — либо перепевки старого либо вариации на тему.

(я бы решил, что человечество уже нашло все возможные мелодии, но вот только четкое совпадение по времени с компьютеризацией творчества и бизнеса меня сильно смущает :)

за его рамками огромное количество музыки, о которой мы даже никогда можем и не узнать


Я был свидетелем того, как песня, рожденная в узком кругу провинциального ВИА — внезапно стала всеобщим хитом в стране.
Что-то стоящее в музыке всегда станет известным, чай не восемнадцатый век сейчас :)

Нет же, я за всяческий плюрализм. А вы брюзжите :) Но я не осуждаю, все там будем. В какой-то момент и я решу, что "переслушал уже столько музыки, что, похоже, таки нашел практически все, что заслуживает внимания", и перестану искать. Но моё мнение, что с современной музыкой всё в полном порядке. Никому его не навязываю, и никого не собираюсь переубеждать. Дискуссионный потенциал нашей маленькой беседы исчерпал себя, благодарю за интересный и содержательный диалог, всего вам хорошего

Да, давайте сравним. У Вас есть какие-то числовые показатели/статистика для сравнения? Или все Ваше сравнение основано на субъективном восприятии и ограниченности кругозора?

У Вас есть какие-то числовые показатели/статистика для сравнения?


Да, смотрим число просмотров и число лайков и комментариев к подборкам музыки разных лет.

Что такое "современная музыка"?

У меня друг на гитаре лабает, как это делали 50 лет назад, например.

Популярная же музыка - музыка настроения. Стали кальяны популярны - под них уже что-то танцевальное слушать не хочется. Станет спортзал популярным - всё будут слушать что-то быстрое, это начнут крутить по радио.

«Это» — что? «Надо» — кому? Я не утверждаю, что Dalle не нужен вовсе чтобы так абстрактно отвечать :)

Насколько я знаю, по информации из открытых источников, человеческий мозг работает точно так же. Т. е. он не может генерировать абсолютно новую информацию. Весь креатив, всё равно базируется на предыдущем опыте.

Человеческий мозг работает намного интереснее, а не «точно так же», как минимум поскольку получает гораздо больше разнообразной информации постоянно и на базе неё может синтезировать гораздо более сложные образы. А является ли мозг «просто вычислителем», и соответственно может ли быть заменён вычислителем с большим количеством мощности — вообще вопрос открытый до сих пор.

По аналогиям: калькулятор работает точно так же как M2? Ну в некотором роде да (базовые принципы совпадают), но M2 гораздо сложнее и содержит больше компонентов, чтоб сделать эту аналогию с одной стороны — неточной, а с другой стороны — скорее вредной и сбивающей с толку. Хотя-бы по той причине, что 5 млн калькуляторов не дадут вам M2, даже не приблизят.

Осталось понять в этой аналогии, чем будет наш мозг через несколько лет - M2 или калькулятором...

как минимум поскольку получает гораздо больше разнообразной информации постоянно

Мозг получает в миллиарды раз меньше информации. Зрение условно 0.3 мегапикселя, и то работающее на 0.1% от максимального значения. Звук паттерн из нескольких частот, мп3 формат успешно этим пользуется, это тоже килобиты информации. ИИ же оперирует гигабайтами информации, не ограничен в ресурсах практически. Человек весь по сути миллиард нейронов в коре, многие из которых дублируют друг друга. Причем медленные, релаксация нейрона по 5 мс, это вообще не те скорости..

С учётом тупости даже передовых моделей типа `LaMDA`, получается, что вы доказываете, что дело не в вычислениях :) я собственно вёл к этому же, но с другой стороны. Единственное — я бы текущие системы ИИ не называл, очень уж им до него далеко.

Основное отличие мозга от машины - это его ассоциативные возможности.

Вот это самое "воспринимая вкус еды на слух, цвет на зуб, вонь на глаз, представляя себе фильм по названию, живопись по фамилии, страну по "Клубу кинопутешествий", остроту мнений по хрестоматии..."

живопись по фамилии
Так вот же, нейросетка из топика легко сгенерирует картину в стиле художника, названного по фамилии.
Так вот же, нейросетка из топика легко сгенерирует картину в стиле художника, названного по фамилии.


Но проблем. Леонардо да Винчи.
Потом позвать эксперта, сказать что найдена картина и предполагается авторство классика.
И выслушать его мнение по этому поводу :)

Миша, перелогинься!

Если бы мозг не мог генерировать абсолютно новую информацию — то мы бы сейчас не тыкали пальцем в сенсорный экран аппарата с 7...28-нм процессором, а сидели в пещерах, кутаясь в звериные шкуры.
НЛО прилетело и опубликовало эту надпись здесь
Но на этом пути много великих открытий. Например, жидкие кристаллы и дисплей на их основе инкрементально не создашь и у природы не подсмотришь. Кто-то должен был заметить эффект и додуматься использовать его именно так.
НЛО прилетело и опубликовало эту надпись здесь

Математическая основа современной криптографии придумана, когда никаких компьютеров не существовало. Да и вообще почти вся математика.

Математическая основа современной криптографии придумана, когда никаких компьютеров не существовало.


Тут скорее так: современные компьютеры получили шанс на существование благодаря криптографии.

благодаря криптографии.

Которая построена на абстракциях, придуманных при свете свечей. Даже паровозов тогда ещё не создали.

НЛО прилетело и опубликовало эту надпись здесь

Про Эйлера не слышали?

НЛО прилетело и опубликовало эту надпись здесь

Эйлер занимался не криптографией, а математикой. И его заморочки с теорией чисел были чисто абстрактным развлечением, пока не пригодились в RSA и DH. Которые торчат теперь из каждого HTTPS соединения ;)

Которая построена на абстракциях, придуманных при свете свечей. Даже паровозов тогда ещё не создали.


«Для декодирования сообщений, зашифрованных при помощи Lorenz, группа математиков и инженеров сначала построила механическую машину Heath Robinson, а затем несколько модификаций электронно-механической машины Colossus. Это позволило получать сведения о решениях верховного командования Вермахта» (с)
Если бы мозг не мог генерировать абсолютно новую информацию — то мы бы сейчас не тыкали пальцем в сенсорный экран аппарата с 7...28-нм процессором, а сидели в пещерах, кутаясь в звериные шкуры.


Если бы мозг человека не мог генерировать абсолютно новую информацию (ака делать правильные выводы :) — то и до пещер дело бы не дошло.
НЛО прилетело и опубликовало эту надпись здесь
Не буду закапываться в бессмысленный спор о том, что такое «абсолютно новая информация» :)


Так выше уже все сказано — инфа №1 (внешняя) + инфа №2 (внешняя) =инфа №3 (новая)
Во-первых, Dalle-2 не просто усредняет, он находит некоторые закономерности в виденном раньше, и строит на этом основании изображение.

Во-вторых, у людей всё точно так же. Только известных образов у большинства из них в нейросетке больше, и сама нейросетка больше, так что больше закономерностей находится.

Никаких признаков какой-то специфической человеческой художественной креативности, в принципе недоступной нейросетям, не просматривается. Уже, на мой взгляд, видно, что различия в уровне пока вызваны количественными причинами, а не качественными. «Криэйторам», конечно, обидно, а так это очень здорово.

Даже по примерам в статье и комментах видно, что закономерности находимые сейчас достаточно прямолинейны. И если отойти от восхищения «машина способна рисовать огого», то в целом образы идут «в лоб», без собственно, артистизма. Если робот, то он выглядит именно так как ты ожидаешь увидеть (по примерам с сёрфящим роботом видно, что вариативность красных роботов очень мала, где терминатор-коммунист в конце-концов) . Если скроллить страницу медленно, сначала читая текст запроса в сетку, а потом хотя-бы минуту пытаясь представить что она выдаст — если не в деталях, то в направлении угадываешь почти всегда. Работа с человеком гораздо неожиданнее и интереснее.

Про то что у людей всё «точно так же», даже не интересно рассуждать ведь на этот счёт ещё нет консенсуса :) даже пресловутое наступление «сингулярности» это гипотеза, а не факт

Мне кажется, вы недооцениваете Dalle-2 и переоцениваете «артистизм», что бы Вы в него ни вкладывали. Увеличить вариативность образов не составляет проблемы. Просто побольше рандома добавить.

Можно даже не перерабатывать модель, а просто в запросе перед описанием добавлять какое-нибудь случайное прилагательное или даже два. Будут вам вариабельные-вариабельные роботы.

Можно даже поэкспериментировать, попросив Aleron75 сделать те же запросы, но с различными определениями: mysterious, cylindric, brutal, shaky, glorious, ajacent, scrupulous, magnificent, poor, broken, crazy, linear, bizzare, huromous, industrial, high-tech, simple, Soviet, unknown, artistic, creative, imaginative, Habric и т.п.

Камон, я со времён первых моделей рисовалок видел, как сначала говорили, что нужно больше железа, потом больше параметров, щас больше рандома и точно будут не нужны дизайнеры/художники/whatever. Проблема в том, что этого никогда не случалось, просто раньше это была совсем скучная мазня, сейчас стало красивее, но тоже скучно :)

Возможно это эффект прототипа, но честно сказать, да, я недооцениваю dalle 2, потому что пока она не показывает ничего интересного, кроме пиара себя) Вполне возможно что её этому ещё не учили, или цель создания была в другом, посмотрим где приживётся.

При этом, я не спорю, что dalle и подобные модели - полезны. И как тысяча примеров, каждый из которых можно взять на доработку, и как поиск образа, когда в голову не идёт и ещё куча полезных использований. Но как самостоятельный «дизайнер» — пока даже не близко.

Да что там рисовалок! С перцептронами та же ерунда была! Сначала сделали первые эксперименты, многообещающие. И говорили, что дальше вопрос уже количественный. А потом вдруг остановилось, наступила Зима искусственного интеллекта.

А потом вдруг выяснилось, что таки проблема и вправду была количественная, и нейросети с большим количеством слоёв привели к реальному прорыву.

Так что Вы не первый скептик и не последний. Это естественно. Но объективно, динамика прогресса в этой отрасли, на мой взгляд, говорит за то, что те претензии, которые Вы высказали к творчеству Dalle-2, либо уже неактуальны, либо станут неактуальны года за 2-3.

Ну, если только мир не накроет кризис, когда станет не до креативности, особенно не до компьютерной креативности.

Я, пока не до конца понимаю, как относиться к Dalle/Dalle-2. Это уже технология, или эксперимент, который ещё ждёт своего времени?

Если технология, то можете подсказать, где используется dalle/dalle2 в пользовательских сервисах (я не для укола, а чтобы понять границы применимости текущие)? Я видел недавно, как обложку Cosmopolitan сгенерировали, но даже там в самой статье пишут: This sure is a lot of human effort for an AI-generated magazine cover. My initial takeaway is that DALL-E truly is an artist’s tool—one that can’t create without the artist. Там на самом деле неплохая статья, от людей которые использовали технологию вживую. И мне кажется она скорее ближе к поинту который озвучивал я о границах применимости — это ассистент. Других «объективных» успехов я что-то не видел.

Если эксперимент, то результаты скорее есть, что неплохо, но поймите меня правильно, то как освещают каждую новость с Dalle/Dalle2, да и многими другими моделями (с текстом, с кодом...), вызывает скепсис чисто подачей «нейросети заменили XXX», когда примеры в самой новости выглядят, ну как, эксперимент в процессе, нежели «замена». Wishful thinking, если хотите.

И то что очередную итерацию моделей проводят под соусом таких заголовков — мне уже кажется тенденцией (могу быть не прав конечно, было бы интересно увидеть разбор поколений алгоритмов и причин по которым они приближают нас к решению текущих проблем) и заставляет задуматься — а в ту ли вообще сторону движется текущий подход, или для прорыва всё же нужна революция в алгоритмах, или революционный рост мощностей, чтобы раскрыть потенциал текущих алгоритмов?

В этом треде звучат очень разные вещи, сливаясь между собой. Давайте, я попробую отделить. Все ответы, конечно, с оговоркой «насколько я знаю/понимаю». :)

> Это уже технология, или эксперимент, который ещё ждёт своего времени?
В текущий момент продукт находится в стадии бета-тестирования. Это не эксперимент, это предрелизный этап коммерческого продукта.

Вероятно, после выведения продукта на рынок, появятся сведения об эксплуатантах.

> то как освещают каждую новость с Dalle/Dalle2… вызывает скепсис чисто подачей
Ну, это вопросы к журналистам. Я обсуждаю только конкретные Ваши претензии к технологии. Так то понятно, что замещение будет постепенным. Как это происходит и с переводчиками типа Google Translate/DeepL, которые уменьшили спрос на услуги переводчиков начального уровня. Но некоторые продолжают пользоваться и услугами переводчиков, результат работы которых хуже, чем у упомянутых автоматических переводчиков. А многие переводчики даже высокого уровня использую автоматизированные инструменты для экономии собственного времени. Так же и тут. В ряде случаев потребность в дизайнерах художниках уже отпадает, и последовательно будет отпадать всё больше и больше. В ряде случаев дизайнеры будут использовать эту и подобные технологии для экономии собственного времени.

> очередную итерацию моделей проводят под соусом таких заголовков
Мне кажется, всё проще. Картинки действительно осмысленные и красивые, большинство людей так не нарисуют. Поэтому они производят впечатление. На основании этого восторженного впечатления, человек может искренне делать избыточно далекоидущие выводы.

Конкретно Dall-e 2 выглядит технологией, готовой к выходу на рынок.
Если для таких целей использование будет бесплатным, то я скорее всего вполне буду её использовать для быстрого создания иллюстраций для оформления презентаций.
Коллеги рассматривают генерацию изображений для indie-игры для смартфона без привлечения художника.
«Творческость», которой, как Вам кажется, Dall-e 2 не хватает, легко управляется «творческим» подбором слов, а также «творческим» предъявлением нужных образцов. Большинство из тех, кто может какую-нибудь игру образов или интересный сюжет картины, сколько-нибудь сносно её нарисовать не могут. Да и у тех, кто может, это требует больше времени, особенно если хочется перебирать варианты.
Dall-e хорош тем, что создавать изображение можно последовательно. Вставлять объекты в существующую картинку, создавать на основе существующей такую же — в таком же стиле, с похожими объектами, с похожей структурой композиции — но другую!

Да и нужно хорошо понимать, что трансформер — это не байесовский предсказатель. Он вполне может работать и с отдалёнными ассоциациями. Как я понимаю, Open AI наоборот подкручивает параметры так, чтобы избегать неожиданных ассоциаций, чтобы не возникало ощущение того, что рисует по-настоящему творческий сумасшедший, чтобы не получить антирекламу.

> скучная мазня
Вам вот не нравится предсказуемость, а большинству-то как раз это и надо — чтобы система рисовала то, чего они хотят, а не что-то своё.
Система создаётся не лично под Вас, и не под суровых сибирских лесорубов из анекдота, а для массового обычного пользователя.

> заставляет задуматься — а в ту ли вообще сторону движется текущий подход, или для прорыва всё же нужна революция в алгоритмах, или революционный рост мощностей, чтобы раскрыть потенциал текущих алгоритмов
Извините, но очень странно пытаться делать это на основании того, какие заголовки используют «изнасилованные учёными журналисты». Не стОит так делать.

Никакого фактора, говорящего о том, что развитие технологий генеративных нейросетей движется «не в ту сторону» Вы пока не привели (ну или я не заметил — простите, коли так).

Непонятно таки пока, зачем Вам вообще что-то революционное. Сформулируйте, пожалуйста, ваши требования к подобной системе, и я попробую в меру своего понимания высказаться, какие из требований уже выполняются полностью, какие — частично, и каковы перспективы.
Наверное, так будет интереснее?

Ну, это вопросы к журналистам

Эээ, нет. Я возможно не удачно сформулировал, но эту статью, например, написал не журналист. Это именно от специалистов/интересующихся которые пишут о явлении замечается. Тоесть как раз у тех, от кого ожидаешь хотя-бы доли критического мышления.

Google Translate

О, думал что не затронем, но именно то что стало с Google Translate и превратило меня из энтузиаста в скептика. Не представляю, как им можно пользоваться, как инструментом, с тех пор, как они переехали на encoder-decoder. Если раньше это был предсказуемый инструмент, который иногда выдавал забавную буквальность в устойчивых выражениях, то сейчас чтобы он не переписал половину текста (далеко не всегда удачно), нужно таскать ему текст кусками меньше предложения, чтоб ограничить его полёт фантазии. Не говоря уж о том, что во французском он не обламывается заменять «ты» на «вы» (или наоборот), что вообще-то меняет построение предложений. И ломает согласованность предложений (часть «ты», часть «вы»). И выдаёт странные результаты с завидной регулярностью. Единственный плюс тут — масштабирование (проще закидывать языки, поскольку при помощи транзитного новое направление это всего 2 новых модели), но для пользователя я честно сказать плюсов по сравнению с 2015 годом в Google Translate не особо вижу, статистические переводчики работали хорошо и предсказуемо. У вас есть какая-то инфа чуть более детальная о том, что спрос на переводчиков начального уровня реально упал от Google Translate?

Это одна из причин моего defensive поведения тут. Я видел хорошие примеры применения нейросетей только в тех местах, где они решают механистическую задачу — автоматизации куска пайплайна, а не замены его целиком. Распознавание текстов в переводчике — это прекрасно. Нейросетевой переводчик — плохо. Помощник саппорта подкидывающий оператору статьи по контексту чата — прекрасно, замена саппорта — худшее изобретение нашего века которое работает только за счёт того что оно очень дешевое. Это повсеместное ухудшение уровня сервиса нейросетями конечно же придёт и в дизайн (ниже иронова притащили, ну посмотрите его работы которые как 2 капли воды похожи друг на друга, зато дешевые).

Вам вот не нравится предсказуемость, а большинству-то как раз это и надо — чтобы система рисовала то, чего они хотят, а не что-то своё.

Вы про большинство как узнали? Опрос проводили, или снимали метрики с какого-то продукта? Если метрики то какие? Мне не первый раз тут большинством тыкают, но я не вижу, что именно (вы тоже пишете что пока нету информации об этом) ждало большинство кроме собственно рисующей нейросети. Из того, что я могу предполагать — большинству всё равно каким образом нарисована картинка которую они видят. Где-то в этом месте появляется ниша для dalle. Всё остальное — неопределённость о которой можно лишь предполагать. Как вы дружно прикидываете потребности большинства от несуществующих ещё услуг — загадка.

Извините, но очень странно пытаться делать это на основании того, какие заголовки используют «изнасилованные учёными журналисты». Не стОит так делать.

Выше отвечал. «Статьи» пишут люди из индустрии. У которых отшибло критическое мышление возможностями по масштабированию и низкими запросами аудитории :)

Непонятно таки пока, зачем Вам вообще что-то революционное. Сформулируйте, пожалуйста, ваши требования к подобной системе, и я попробую в меру своего понимания высказаться, какие из требований уже выполняются полностью, какие — частично, и каковы перспективы.

Видите в чём дело, как к технологии у меня претензий к dalle нет, он уже полезен, я об этом в каждом сообщении пишу. Но у него, есть свойства, которые его ограничивают и тенденции к изменению которых не видно (даже если сравнить dalle и dalle 2, не видно чтобы они шли к замене дизайнера).

Если рассуждать в терминах применения dalle 2, для (цитирую вас же): человеческой художественной креативности, то есть некоторое количество нерешенных проблем:

  1. Неуникальность. Дизайнер контролирует уникальность и пересечения образов в логотипе, например — это серьёзная проблема всегда (в айдентике, менее критично, но всё же). Если выпустить dalle в дикую природу as is, как вы думаете, сколько людей в сид введут red robot's head uhd, пытаясь придумать логотип для своей студии разработки? Посмотрите на сёрфящих роботов выше. Вот примерно так будут выглядеть эти лого у десятков студий. Решаема ли эта проблема? Наверное. Но вот сейчас так.

  2. Прямолинейность. Если сервис продаётся сразу бренду (ваш вариант), а не дизайнеру (мой вариант), то пользователь имеет право ожидать сразу готового результата применимого без обработки. Допустим бренд-менеджер готов сам следить за уникальностью (получая работу от дизайнера он тоже должен за этим следить, допустим), но получается, что чтобы получить результат, ему придётся заниматься итерациями с сидом. Затратная ли это работа? Ну почитайте статью Cosmo, про их обложку — там пишут что на это ушло ~12 часов человеческого времени. При том, что у них уже была возможность «дорисовки», тоесть по идее можно было черри-пикать удачные части или даже набросать самому часть, чтоб направить в нужное русло. Это выглядит как профессиональный инструмент требующий тонкой настройки, а не пользовательский сервис.

  3. Качество. Опять же. Посмотрите на сёрфящих роботов и включите хотя-бы чуть-чуть критического мышления. Часть из них сёрфят по песку, у большей части волна по отношению к берегу имеет странный ракурс, а часть не сёрфит, а скорее летает на водной струе. Посмотрите на пиксель-арт и обратите внимание на то, что это не пиксель-арт, а имитация, где пропорции и размер пикселей чаще всего не совпадают. Я уж не говорю, про то, что много анатомических, или эстетических огрехов (когда в целом неплохой вариант, например, имеет отсутствующий зрачёк, или волосы не в том месте). Если «жрать что дают», оно конечно можно выбрать перебрав сотню-другую вариантов, но вы пишете что система почти готова к коммерческой эксплуатации. Пока это выглядит скорее как сырой прототип для этой задачи.

Есть ли у этих проблем решение? На мой взгляд это решение — человеческое сознание, которое позволяет создавать отличающиеся от друг-друга вещи (пересечения бывают, но нередко они вызывают проблемы, поэтому это точно не норма, а случайность), высказываясь в контексте бренда/продукта, но не «в лоб», а находя интересные параллели и идеи как в визуале, так и в значении (у робота тут остаётся лишь вариант «значение» который при текстовом сиде не включает большу́ю часть контекста, а визуал робот может покрыть только количеством генерируемых вариантов) при этом контролируя качество (я сейчас не говорю о визуальных стилях, примитивизм, например, тоже уважаемый стиль, который можно интересно применять). Робот же, предлагает лишь упрощённую имитацию (и это не форма речи, посмотрите на пиксель-арт и поймите, что все остальные «стили» робота столь же несовершенны, просто их сложнее распознать, потому что они сами сложнее). А на пути к чему-то близкому к сознанию, пока даже чуть более направленные в это русло текстовые модели — не блещут. Может быть оно поменяется в будущем? Конечно! Но пока предпосылок не видно.

НЛО прилетело и опубликовало эту надпись здесь

Там сид: smart red robot surfing the wave

> Я возможно не удачно сформулировал, но эту статью, например, написал не журналист.
Журналист-журналист! В данном случае он именно гражданский журналист. Который поставил демонстративно желтушный заголовок для привлечения большего внимания к статье. По этому заголовку не стоит делать вообще никаких содержательных выводов.

> Не представляю, как им можно пользоваться, как инструментом, с тех пор, как они переехали на encoder-decoder.
Извините, если прозвучит некорректно, но вероятно именно здесь и лежит проблема, мешающая Вам объективно воспринимать прогресс в обсуждаемой сфере. Подавляющее большинство пользователей считает, что новая технология перевода даёт значительно лучший результат, чем старая. Это я могу достоверно утверждать по той простой причине, что Гугл очень тщательно мониторит обратную связь, и если бы большинство разделяли бы Ваше восприятие, то старый вариант если бы не был возвращён, то хотя бы активно предлагался к выбору в качестве запасного.

И научное сообщество тоже уже сделало однозначный вывод уже в далёком 2016-м году.

Вы — в явном меньшинстве, поэтому если Вы хотите прикинуть, как будет идти развитие дальше, Вам стоит абстрагироваться от собственных ощущений.
Если написанное Вами («не представляю, как можно пользоваться») — не фигура речи, а действительное непонимание, то абстрагироваться будет очень непросто, но, на мой взгляд, без этого никуда.

Взял кусочек Вашего письма и перевёл Google Translate и DeepL.
Ни у одного не вижу здесь заявленного Вами «полёта фантазии». Возможно, у Вас речь идёт о каких-то художественных текстах, с ними пока похуже.

> У вас есть какая-то инфа чуть более детальная о том, что спрос на переводчиков начального уровня реально упал от Google Translate?
Возможно вот это Вас убедит в существовании реальной тенденции.

> 1. Неуникальность.
Это как раз не представляет проблемы на текущем уровне развития технологий. Поиграйтесь с сетками попроще, где можно ряд параметров задавать. Я думаю, и в Dall-e 2 будет возможность настраивать степень уникальности. Это совсем не сложно сделать на фоне того, что они уже сделали, а действительно в ряде случаев может быть весьма полезно.
> 2. Прямолинейность.… ему придётся заниматься итерациями с сидом
Не обязательно непосредственно с сидом. Можно уточнять в духе «отлично, а теперь сюда поставьте котёнка». С людьми то же самое.
Пример с Cosmo показывает, что технология применима уже даже не только для дизайна начального уровня. Речь же пока идёт об дизайне начального уровня (самом массовом, кстати говоря), как и выше шла речь об переводе начального уровня.
Но самое главное, вы сейчас говорите о случае, когда исполнитель лучше заказчика знает, чего ему надо. Эта задача сейчас в принципе тоже активно решается Гуглом, но Dall-e такой задачи не ставилось, её на это не тренировали, и странно от неё этого ожидать. Это не проблема технологии, это даже не проблема конкретного продукта — это просто предъявление к продукту дополнительного далеко не приоритетного требования.
> 3. Качество.
Это, на мой взгляд, пожалуй, единственное, что из перечисленного Вами действительно является проблемой технологии. Но здесь ключевое — это динамика этого качества. Видно, что артефактов становится меньше и меньше, и уже надо присматриваться, выискивая их — и если использовать не фотореалистичный стиль, то ещё поди разбери, где артефакт, а где — художественный приём. Однако Ваши конкретные претензии тоже не выглядят проблемой технологии. Про песок легко можно уточнить запрос (сид). Про пиксель-арт — использовать примитивнейший пост-процессор. Попробуйте попросить человека мега-дизайнера нарисовать пиксель-арт на бумаге без клеточек, без измерительных инструментов — думаете, у него пиксели сильно ровнее будут?

Что касается проблем стилей — да, у него прослеживаются проблемы, типичные для наивного искусства — т.е. когда автор не имеет художественного образования. С учётом отсутствия у Dall-e художественного образования, вряд ли это удивительно. Удивительно, скорее, обратное — что в его работах меньше ошибок такого рода, чем в работах людей без художественного образования. Вот все эти понятия о пространстве, перспективе, тенях, анатомических пропорциях, которые в классическом художественном образовании закладываются алгоритмическими методами (т.е. даже для такого мощного вычислительного комплекса, как человек, проще использовать алгоритмический подход), у Dall-e работают просто на обучении большим количеством примеров. И причём, опять же, хорошо видно, что с количественным прогрессом падает и количество таких ошибок. Можно ввести алгоритмическую доработку такого рода. Это посложнее, чем пискелизация, но это обычная не слишком сложная алгоритмическая задача, никаких технологических прорывов не требующая. Если вдруг наткнутся на какую-то стену в машинном обучении, то именно по этому пути и пойдут — алгоритмического/эвристического постпроцессинга. Да и то сказать, если возвращаться к машинному переводу, то кроме машинного перевода есть ещё и машинные корректоры. И я встречал публикацию об эксперименте, когда натравливали вторых на результат работы первых, и потом сравнивали с переводами, сделанными людьми, на простых текстах испытуемые чаще отдавали предпочтение варианту, сделанному при помощи машин.

Ну вот правда же, проблемы у нейросетей вполне есть, но подавляющее большинство из того, что Вы и многие другие комментаторы считаете проблемами — таковыми не являются. Совершенно не требуется приплетать сознание для того, чтобы создавать «отличающиеся от друг-друга вещи». Посмотрите на Николая Иронова — там на сайте есть ссылки на публикации с примерами его работ. К качеству есть вопросы, но то, что вещи там «отличающиеся» — несомненно. Возможно, это Вас в чём-то убедит.

В данном случае он именно гражданский журналист.

Окей, играем словами, эту ветку я предлагаю закрыть потому что вы пишете ерунду :)

Это я могу достоверно утверждать по той простой причине, что Гугл очень тщательно мониторит обратную связь, и если бы большинство разделяли бы Ваше восприятие, то старый вариант если бы не был возвращён

Да, как гугл вернул reader, закопал amp (который юзеры так любят, что несколько месяцев после запуска платных расширений для safari в топе покупок висело расширение которое убирало amp и редиректило на обычную страницу), вернул inbox и в целом замечательно порешал кучу локальных драм. Гугл делает то, что нужно гуглу. Если гуглу дешевле новая нейросеть, то она будет вместо старой, а она дешевле на порядки, поскольку позволяет запускать направления перевода с пол пинка.

Про статью и качество — зачёт, но всё упрощает английский. Вы работали с системами NLP? Я вот работал. Модели в которых участвует английский, всегда показывают себя заметно лучше на всех уровнях. Даже банальный парсинг русского, например, будет делаться хуже и учитывать меньше edge case. Данных которыми кормят модель тоже больше на английском. В моём случае пара ru-fr с которой не так гладко всё работает. Но окей, допустим тут это bias.

Про Иронова я упоминал, и если вы считаете что то что он делает как-то заметно друг от друга отличается — то в целом как вы выше написали мне: извините, если прозвучит некорректно, но вероятно именно здесь и лежит проблема, мешающая Вам объективно воспринимать прогресс в обсуждаемой сфере.

---

BTW. Спасибо в целом за диалог местами было интересно. Если про переводчиков, я в целом и до этого понимал, что заметная часть проблем это моя специфика (набор текстов + требования + языковая пара ru-fr, а не типичная ru-en), то с рисовалками, вы меня не убедили. Много условностей, много «да это легко», но после dalle 1, я наблюдал примерно тот же энтузиазм, а воз собственно и ныне там. Посмотрим. Вы с надеждой, я со скепсисом.

> Окей, играем словами, эту ветку я предлагаю закрыть потому что вы пишете ерунду :)
Ну, если уж я пишу ерунду, то страшно представить, что пишете Вы! :)

Это не игра словами. Топик стартер поделился с широкой аудиторией ощущениями от игрушки, которую ему дали попробовать. Это чисто журналистская деятельность. Поскольку это не профессиональная деятельность, то это — гражданская журналистика. То, что он специализируется в data science (что близко, но всё же не технология Dall-e), даёт ему некоторую компетентность, но не более того. Журналист не обязан быть некомпетентным в описываемой области.

По поводу Гугла: эти локальные драмы кажутся важными им участникам, но не важны для массового пользователя — на которого, собственно, и ориентируется Гугл. Я вижу здесь тот же проблемный паттерн, наличие которого у Вас я предположил (снова прошу простить, если некорректно) ранее: придаёте слишком большой вес миноритарному мнению.

Кроме того, Вы говорите о закрытии ненужных сервисов. С переводчиком Гугл на важном для него конкурентном рынке, с сервисом, закрывать который он не собирается. Можно же использовать NMT только на новых направлениях, а на старых — как минимум на двух приоритетных парах — en-es и en-fr, оставить SMT. И если бы оно давало лучшие результаты, его наверняка оставили бы. Вычислительных-то ресурсов SMT как раз ест меньше, так что тоже была бы экономия.

По поводу английского в NLP: да, конечно, с ним работа обстоит лучше. Причина, опять же, количественная. NMT, в отличие от многих других подходов, как минимум к остальным индоевропейским языкам применимы ничуть не хуже, чем английский. То есть вся разница, которую Вы видите — это не вопрос технологии, это только количественный вопрос набора данных. Скормите системе столько же ru-fr данных такого же качества, сколько и каких скормили ru-en, и получите такой же результат. По-моему, это ещё один чёткий звоночек, который должен прозвучать для Вас, что не всё, что вам кажется проблемой именно технологии, является таковой. А в реальности действительно является вполне преодолимым количественным вопросом, который просто сочли менее приоритетным, чем другие.

Про Иронова: да, простите, он здесь несколько раз всплывал, и я запамятовал, что Вы его тоже вскользь упоминали. Ок, давайте обсудим «мешающую мне проблему», если она подтвердится, я попробую найти пути её решения. Вот, например, ссылка на сгенерированные им логотипы на стоп-кадре. Вы правда считаете, что они все одинаковые, и что у дизайнера средней руки разнообразие кардинально выше? Вы не могли бы попробовать убедить?

> воз собственно и ныне там
Я, повторюсь, но другими словами :)
Воз для Вас и ныне там по той причине, что разработчики систем ИИ решают не те задачи, которые интересны Вам, а те, которые интересны большинству (и имеют, соответственно, лучшие рыночные перспективы).

Что касается надежды, то я как раз настороженно смотрю на прогресс закрытых систем. И для развития человечества, и для безопасности (в том числе от диктата тех или иных игроков) важно, чтобы такие вещи были свободными или хотя бы полностью открытыми.

Студия Артемия Лебедева использовала нейронку для создания материалов. Насколько я понял успешно это комерциализировала. Так что нейросети уже де-факто комерческо применимые средства. Конкретно dalle очередной шаг эволюции. Думаю уже нет смысла пытаться делить это на технология/эксперимент. Мы живём в мире где все программное обеспечение одновременно находится и в состоянии эксперимента и в состоянии продукта. Инста, твич изначально задумывались и работали не сколько по другим направлениям и в процессе сменили его. Любые масштабные сервисы имеют множество фич на а/б тестировании. Ничто не имеет конечного, финального, 'технологичного' состояния. Все подверженно изменениям. Dalle - технология не доступная широким массам.

Не понимаю претензии многих комментаторов по поводу однотипности и отсутствия 'художественного' видения при реализации запросов. Это особое видение никому не нужно. Если у конечно пользователя запрос на red robot то и изображение должно строго соответствовать этому. Лишние элементы будут только мешать и приводить к дополнительным циклам перерисовки по запросу. Пользователь знает что ему нужно и при необходимости будет дополнять описания для получения требуемой детализации. Но только тогда когда это действительно востребованно, а не наоборот. Это то как должен работать дизайн в современном мире. Кмк.

Студия Артемия Лебедева использовала нейронку для создания материалов.


И где она сейчас?

Если бы вы действительно интересовались вопросом который задали то очень быстро бы нашли ответ в Гугле: https://ironov.artlebedev.com/ru/#

С ней все в порядке.

очень быстро бы нашли ответ в Гугле: ironov.artlebedev.com/ru/#


Спасибо, но вопрос был не об этом.
(еще лет десять назад термин «бизнес-линч» был знаком каждому уважающему себя студенту.
Сейчас же фраза «автор этого знака — Артемий Лебедев» уже ничего не говорит молодому поколению)

А началось падение как раз с Коли Иронова (Джон Федор, да :)
Так сам Лебедев давно уже отошёл от дел, а дизайном занимаются совсем другие люди от его имени. «Студия» же, товарный знак, а не конкретный человек.
«Студия» же, товарный знак, а не конкретный человек.


Ок. Фраза «Студия Артема Лебедева» уже ничего не говорит молодому поколению.

я так понимаю, люди платят не столько за то, что им рисует студия Лебедева, сколько что кучу понтов доставляет то, что именно именитая студия им что-то сделала. Да много чего так в мире, сумка Луи Виттон сумка и сумка, да что надо от сумки, а стоит как новый BMW

студия Лебедева, сколько что кучу понтов доставляет то, что именно именитая студия им что-то сделала.


Именитая — это Zaha Hadid Architects :)

Это особое видение никому не нужно.

(sigh) А вы всех опросили? Меня вот забыли кажется.

Какой вопрос задавали? Что именно предлагали альтернативой? Плохонькие арты в лучшем случае напоминающие изначальный стиль? Тысячу одинаковых вариантов, вместо вариатива? Вы пишете:

Если у конечно пользователя запрос на red robot то и изображение должно строго соответствовать этому.

Но как можно нарисовать _строго_ соответствующее нечто, если у robot нет строгого образа по ГОСТу, а у red которое произносит пользователь, нет строгого RGB кода подразумеваемого пользователем?

Лишние элементы будут только мешать и приводить к дополнительным циклам перерисовки по запросу.

Почитайте статью Cosmopolitan, которые вживую пользовались этим. 12 часов перерисовывали _строго соответствующий_ запросу результат.

Пользователь знает что ему нужно и при необходимости будет дополнять описания для получения требуемой детализации

Тоже сильное допущение, потому что пользователь не знает что ему нужно, _если пишет_: red robot surf wave. Он имеет общее представление, а выяснить детали и создать образ — это отдельная работа, которую на данный момент робот не решает.

Это то как должен работать дизайн в современном мире

Кому должен?

Кмк

Вам кажется.

НЛО прилетело и опубликовало эту надпись здесь
Ну, да, но разница-то всё равно количественная! :)

После перцептрона и многослойные нейросети были придуманы. И даже ключевые методы работы с ними. Метод обратного распространения ошибки для многослойных нейросетей в своей основе — середина семидесятых. И веса не проводками менялись, а вполне программным образом.

Но реальный прорыв случился только когда оборудование позволило делать огромные сети, обучать их на огромных массивах данных, и играться огромным множеством возможных конфигураций. Но принципиально причины прорыва — количественные. Слово «огромные» в этом абзаце — ключевое.
Но реальный прорыв...


Реальный хайп…
Я прямо диву даюсь.

Распознавание лиц, вообще компьютерное зрение, автоматический перевод, игра в Го (и вообще закрытие вопроса со всеми подобными знаменитыми интеллектуальными играми) полностью прошли мимо Вас?

И даже резко выросшее качество фотографий, которые делают камеры телефонов?
Я поражаюсь, ну как можно настолько игнорировать реальность?!


Я слежу за темой ИИ еще со времен публикаций научно-популярных статей на эту тему в журнале Знание-Сила (это начало 70х).

Тема идет волнами, то всплывая наверх, то затихая.
Причем перечень направлений практически не меняется — распознавание изображений, перевод, игры (раньше были шахматы, теперь Го :)
Я помню фильм «Кто за стеной?» (1977), актуальный и сейчас.
Помню статьи о Элизе (ELIZA) и ее диалоги, поразительно похожие на диалоги LaMDA — это была хайповая тема и в 60х и в начале 80х.

И даже резко выросшее качество фотографий, которые делают камеры телефонов?


О, кстати — как отключить эту функцию в айфонах, стабильно портящую все портретные снимки подряд? :)
Оно, разумеется, идёт волнами, но какое это имеет отношение к тому, что мы обсуждаем?!

То, что Вы активно следите, возможно, и сыграло с Вами злую шутку, сформировав завышенные ожидания, которые всё никак не реализуются. Причём даже как-то очень непонятно завышенные, если для Вас системы на ИНС до сих пор не превзошли человека в игре в го.

Тогда были первые эксперименты, сейчас — уже состоявшееся практическое использование, активно расширяющееся.
Не видеть этого и называть всё «реальным хайпом» — ну, извините. Не буду Вам мешать.
Оно, разумеется, идёт волнами, но какое это имеет отношение к тому, что мы обсуждаем?!


К тому, что сейчас идет очередная волна.

сформировав завышенные ожидания, которые всё никак не реализуются.


Есть целый ряд таких ожиданий, заложенных еще в детстве — мирный термояд, космонавтика, искусственный интеллект и прочее.

ИИ — только одна волна из многих.

уже состоявшееся практическое использование


Да, на уровне сабжа этой статьи.
(Марк Твен мечтал об автоматическом текстовом редакторе (механическом) и даже слегка разорился на опытных образцах. Прошло 150 лет, но ИИ все еще не способен автоматически форматировать текстовые документы по заданным параметрам (стандартам))
А ведь казалось бы — база есть, остались мелочи.
К тому, что сейчас идет очередная волна.

Волна, вероятно, идёт, но это не имеет ни малейшего отношения к тому, что мы обсуждаем. (И уж точно никак ему не противоречит — если уж натягивать связь на глобус, то получится скорее напротив — с учётом того, что достигнутые на прошлых пиках практические результаты не переставали использоваться в ходе прошлых «зим» понятно, что перечисленнное мной практическое использование уже никуда не денется.)

Есть целый ряд таких ожиданий, заложенных еще в детстве

Я боюсь, что с такими ожиданиями каши не сваришь. Детские мечты они такие — часто нереализуемые в принципе. Лучше формулировать конкретные требования, и потом анализировать динамику приближения к ним тех или иных подходов и решений.

Да, на уровне сабжа этой статьи.

Это какая-то абстракция. Что за уровень, что из него следует… Одна сплошная субъективщина! Я же выше написал вполне предметно, указал не исследовательские, а вполне практические рынки. Признайте для себя хотя бы то, что в игре в шахматы GAN'ы человека превзошли…
Волна, вероятно, идёт,


Волна, очевидно, идет.
(сколько их уже было в ИТ за последние тридцать лет — можно целую историю написать, начав со слова «мультимедиа» :)

что перечисленнное мной практическое использование уже никуда не денется


Я на всякий случай глянул ваше предыдущее сообщение — нет, я не ошибся, вы упомянули только игру в Го (одна из игр, основанная на переборе вариантов, в которых человек пасует перед мощью вычислительных систем)
Чуть раньше вы упомянули распознавание лиц (функцию, которую человек осваивает в первые месяцы жизни), и перевод (вот его было бы лучше совсем не упоминать, в силу того бреда, что выдается при переводе живой, не адаптированной речи :) Кстати, с распознаванием отсканированного текста дела немногим лучше, так как программы распознавания абсолютно не понимают смысла ни речи, ни текста (что в первую очередь и требовалось от ИИ).

Я боюсь, что с такими ожиданиями каши не сваришь.


Напомню, что речь идет о хайпе.

Лучше формулировать конкретные требования, и потом анализировать динамику приближения к ним тех или иных подходов и решений.


Где-то в конце 50х в ТМ был опубликован первый шутливый НФ-рассказ о роботакси.
И вроде как есть динамика приближения (ладно, 70 лет — не срок :), но, один нюанс — руки водителя таки должны быть на руле :)

Это какая-то абстракция. Что за уровень, что из него следует…


ИИ научился смешивать и комбинировать образы, созданные не им самим (что с успехом может сделать любой халтурщик, умеющий рисовать и зарабатывать на этом деньги)
И опять же, хайп по этому поводу…
Только получается тот же калейдоскоп, потому как даже халтурщик вкладывает в свои работы какой-то смысл.

Признайте для себя хотя бы то, что в игре в шахматы GAN'ы человека превзошли


Это достижение 1997 года, из прошлой волны :)
Игра, основанная на переборе вариантов, и компьютер справляется с этим перебором быстрее человека. ИИ тут вообще не в тему.
НЛО прилетело и опубликовало эту надпись здесь
Го же как раз такая игра, в которой должен был пасовать перебор вариантов перед мощью человеческого разума.


Гм, вам приходилось играть в Го? :)
Там, по сути, точно такой же принцип, как в крестиках-ноликах, только число вариантов намного-намного больше.

Ещё буквально шесть лет назад это было непреложной истиной


Да, я я в курсе того хайпа, который был в СССР вокруг этой игры :)
Промышленность СССР даже наладила выпуск отечественных наборов для Го (доски и наборы фишек), один из которых лежит сейчас у меня дома.
Хотя, несмотря на волну, поднятую научно-популярными журналами вокруг этой игры — найти партнера было крайне тяжело — старшее поколение предпочитала клетчатые доски и домино, младшее — намного динамичное «реверси».

Следом был непобедимый покер.


Никогда не встречал людей, всерьез игравших в покер с машиной (хотя программ таких была масса, включая и эротические).
Там весь смысл игры в игре с живыми людьми.

А потом в один миг ИИ победил


Так память у компьютера хорошая, почему бы нет :)

(мы в колхозе во время сельхозработ, от полного безделья играли в «дурака» двое на двое.
Итоговый результат полностью подтвердил точность изучаемого тогда нами теорвера — 49/51 на сто партий. Т.е. при правильной карточной игре все упирается в вульгарную статистику :)

Сейчас перевод недостаточно художественный, ага.


Не, он просто бредовый, так как ИИ-переводчик не понимает контекст… если бы, он даже слова не распознает правильно, четко произнесенные в микрофон…

И ах, его можно запутать, если правильно конструировать двусмысленные предложения.


Вы это рассказываете человеку, который ежедневно использует голосовой переводчик (от MS) для общения с людьми :)

И текст оказывается не распознаётся и субтитры наверное из аудио не генерируются


А с субтитрами точно такая же история, что и с переводом (было бы странно, если бы было иначе :)

Ну и Файнридер, платный и дорогой, при распознавании текста, качественно напечатанного на хорошем и правильно заправленном принтере, при сканировании через дорогущий документ сканер — уже который год и версию — тупо продолжает распознавать число 30 как ЗО («нет такого слова!» (с) — но для хваленого ИИ оно таки есть :)

ерунда, что эти технологии закрывают 95% кейсов


Да, читаешь документы и впадаешь в шок и трепет от того бреда (ошибки перевода и распознавания), что становится все более и более массовым.
Волна, очевидно, идет.

Далась Вам это волна! :) Ну, возможно, идёт себе и идёт, это не имеет ни малейшего значения, когда мы обсуждаем, есть ли что-нибудь ещё, кроме хайпа.

Я на всякий случай глянул ваше предыдущее сообщение — нет, я не ошибся, вы упомянули только игру в Го

Вот моя ключевая реплика:
Распознавание лиц, вообще компьютерное зрение, автоматический перевод, игра в Го (и вообще закрытие вопроса со всеми подобными знаменитыми интеллектуальными играми) полностью прошли мимо Вас?

(Чтобы было понятнее: шахматы и шашки тоже входят в число «подобных знаменитых игр».)

Чуть раньше вы упомянули распознавание лиц (функцию, которую человек осваивает в первые месяцы жизни), и перевод (вот его было бы лучше совсем не упоминать, в силу того бреда, что выдается при переводе живой, не адаптированной речи :)

Вы опять от важных фактов уходите в свою субъективную оценку, которая не имеет существенного значения. Для практического использования не имеет значения, как именно прогрессирует процесс у человеческих детей и как вы оцениваете качество результата. Есть объективные факты 1) о том, что указанные технологии широко представлены на обычном массовом рынке, и количество сумевших удовлетворительно решить с их помощью свою задачу огромно. 2) качество работы систем 60-х было недостаточно высоко для удовлетворения подавляющего большинства клиентов.

не понимают смысла ни речи, ни текста (что в первую очередь и требовалось от ИИ)

Этого никогда не требовалось, не требуется и я уверен. что и не будет требоваться в первую или даже во вторую очередь. «Понимание смысла» — это такой философский вопрос, интересный, любопытный, но в целом далеко не ключевой. В научной среде нет даже универсального консенсусного понимания, что такое понимание (pun intended). Так что вся эта философия идёт своим чередом, а развитие систем искусственного интеллекта — своим. Пользователям нужно решение интеллектуальных проблем на удовлетворяющем их уровне. Выше уровень — больше таких пользователей.

От OCR потребителям не понимание нужно, а перевода изображения текста в текстовый формат. Что OCR довольно неплохо давно и делают — так, что потребители активно пользуются этим инструментом в своей жизни.

Напомню, что речь идет о хайпе.

Нет, речь идёт не о хайпе, а о Вашем ошибочном утверждении, будто кроме хайпа ничего нет. Это принципиальная разница.

ИИ научился смешивать и комбинировать образы, созданные не им самим (что с успехом может сделать любой халтурщик, умеющий рисовать и зарабатывать на этом деньги)

Ну, т.е. Вы сами понимаете, что ИИ научился делать то, что раньше могли только люди, и причём эта задача («халтура» по-Вашему) пользуется определённым спросом, раз людям за это платили деньги. Dall-e 2 пока на рынок не вышел, а вот про MidJourney мне вполне известно, что сгенерированное им потом используют, выдавая за человеческое творчество (кто-то пассивно путём умолчания, кто-то активно обманывая) и успешно зарабатывают на этом деньги.

То есть объективно даже плоды этой не перечисленной мною тогда технологии уже вполне конкурентоспособны на человеческом рынке.

Игра, основанная на переборе вариантов, и компьютер справляется с этим перебором быстрее человека. ИИ тут вообще не в тему.

Но ведь эта фраза в очередной раз не имеет ни малейшего отношения к моей! (Кроме того, они обе про компьютерные шахматы.) Никаких GAN в 1997 ещё не было. Их гипотетические предтечи точно не играли в шахматы. Игра GAN в шахматы (именно игра, а не обучение) основана не на переборе, а на паттернах. К сфере ИИ традиционно относят и переборно-эвристичекие подходы к игре в интеллектуальные игры, но уж GAN-то не отнести к ИИ — это совсем удивительно.

В общем, Вы не последовали даже этому призыву:
Признайте для себя хотя бы то, что в игре в шахматы GAN'ы человека превзошли


При таком раскладе дискуссия получается слишком затратной и малопродуктивной. Что ж. Ну, извините. Теперь точно не буду Вам больше мешать. :)
НЛО прилетело и опубликовало эту надпись здесь
Эта тема в 60е годы и сейчас по практическому применению отличается как «хайповый» самолёт братьев Райт от современной авиации.


Увы, по этой аналогии мы сейчас на уровне самолета Bleriot XI

Предлагаю провести опыт, взять готовые арты с высокой "креативностью", описать сюжет текстом и скормить нейросети. Если кто-то будет делать такой опыт, попрошу выбрать одну картинку нашего иллюстратора Ивана Билибина.

Вы читали здесь текст про картинки к книжке про девочку тестировщицу? вот там был именно заказ на эту конкретную девочку и ситуации. И такого запроса наверное много больше в коммерческом плане, чем на крышеснос и огого.
https://habr.com/ru/post/663328/


Вот интересно, насколько Dalle может выполнять такие запросы, то есть фиксировать героя и ставить в разные ситуации.

Вот да, я бы для начала сгенерировал для той же книжки при помощи dalle набор 10-15 рисунков в одном стиле с запрошеными ситуациями, а потом говорил, что она лучше чем человек для данных задач :) а потом не брался бы оценивать рынки каких задач больше, или меньше не имея цифр. То что dalle найдёт свою нишу несомненно, то что это не будет замена дизайнера - тоже.

а потом не брался бы оценивать рынки каких задач больше, или меньше не имея цифр

Задача "сделать прям свое вау! прям такое, чтобы непохоже на всех и за душу брало" — это задача художника из галереи.
Задача дизайнера — сделать чтобы максимальной аудитории понравилось и максимальным тиражом продалось. Это не обязано включать артистизм, но должно быть в достаточной мере предсказуемо. (была хорошая статья про нейросетку, угадывающую хиты до того как они успеют понравиться — передача из этих хитов на радио провалилась. Их было слишком много подряд, не достаточная предсказуемость напрягала. Когда стали ставить "предсказанные" песни в ротацию по одной, среди давно крутящихся песен — оценка нейросети сошлась с оценкой слушателей)
Вы уверены, что цифры рынка нужно прям сильно исследовать для этих двух категорий?

Дай пять, бро! Нейросетка еще долго на сможет нарисовать в качестве робота оживший памятник Ленину по запросу "красный робот" и соответсвенно робота с какими-то биологической-деревянными компонентами в контексте "зеленый робот". Вот в этом промежутке и будут хреначить человеческие художники. Если их творения тут же будут скармливаться сетке - чтож, теперь мы знаем зачем изобрели NFT

НЛО прилетело и опубликовало эту надпись здесь

ЛОВИТЕ НЕЙРОСЕТКУ!!!

на самом деле

предыдущий оратор, когда говорил "красный робот", имел в виду "коммунистический робот", а "зелёный робот" — "нежный к природе робот". Естественно, вторичные смыслы в словах "красный" и "зелёный" нейросетка не видит.

НЛО прилетело и опубликовало эту надпись здесь
Это называется чтение мыслей. Как должен даже человек без контекста об этом догадаться? «А я под словами красный имел в виду раскалённый, ну что непонятного? А я коммунистический. А я имел виду красивый.»


Еще СССР.
Человек стоящий на остановке трамвая, вглядываясь в даль трамвайных путей с раздражением восклицает:
«Ну где же эта красная сволочь!»
— все люди, стоящие рядом, тут же понимают эту фразу в обоих смыслах :)

(трамваи в городе, были выкрашены, естественно, в красный цвет :)
на самом деле


На самом деле и слово «робот» имеет несколько значений, но сетка знает только самое попсовое…
НЛО прилетело и опубликовало эту надпись здесь
Да, на самом деле под красным роботом очевидно понимается горящий красным светофор в Южной Африке.


image

совершенно верно, нейросетка еще долго не будет видеть по запросу "красный робот"

красивого робота,

робота в бане,

робота, который в гневе,

робота - индейца (о да! - вождь краснокожих),

робота, внутри которого короткое замыкание и он того гляди взорвется

робота с Марса

кстати, можно же и от обратного пойти - "что-то красное, поэтому робот" к примеру глава компартии Китая ведет себя подозрительно спокойно.

Вот так я, не напрягаясь, придумал 6 вариантов помимо коммуниста. Двадцать человек придумают сто вариантов. Пятеро наркоманов придумает 2000 вариантов, причем в половине случаев какой-то смысл будет. Если нейросетке скормят всевозможные смыслы, которые породили человеки, она начнет выдавать нерелевантный результаты.

В итоге люди-художники будут поражать смыслы, я так понимаю.

НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
Человека-дизайнера, который по простому и чёткому заданию «нарисовать красного робота» будет молча рисовать Ленина-киборга (прозрачного цвета в форме котёнка, не иначе), в большинстве мест выставят за дверь, а может и в психушку сдадут… Ну, по крайней мере, размышления в эту сторону будут.

Второй "Кот + человек" и вовсе Кнорозов с его котом.

А вы думаете, что человеческая креативность - это что-то другое?

Конечно что-то другое, откуда эта тяга всё упрощать.

Вот тоже хотел Вам ещё вчера написать про бритву Оккама, но отвлёкся, а потом забыл.

Этот принцип гласит: «не следует привлекать новые сущности без крайней на то необходимости».

У Вас для уверенного утверждения «конечно что-то другое» нет никаких оснований. У вас есть только Ваше ощущение, которое точнее было бы передать «мне кажется, что скорее всё же что-то другое».

Динамика расширения диапазона решения ИНС творческих задач, и в особенности то, что этот расширение связано не с какими-то фундаментальными открытиями, а носит в основном количественную природу, даёт серьёзные основания предполагать, что существо креативности у людей и ИНС одинаковое, и с увеличением доступных ИНС ресурсов преимущества людей в решении задач, требующих креативности, будет неуклонно уменьшаться.

Вы бритвой оккама отсекаете голову. Принцип научного скептицизма вам не знаком наверное? И то что бремя доказательства лежит на утверждающем? И то что сомнение - ключ к прогрессу? Вы аргументируете абсолютно религиозно, вообще не подвергая сомнению то что вы хотите видеть. Это понимаемая точка зрения, но вы банально не приближаетесь с таким подходом к истине. В отличии от постоянного сомнения и поиска. В то время как в сообществе все ещё идут дискуссии о природе креативности и мозга, вы религиозным абсолютно образом решили что ответы уже найдены. Я раз за разом пишу, что вижу пользу которая ограничена, что никаких доказательств того что суть креативности уже найдена или тем более вычислима вообще не найдено (то же Сундар Пичаи в 21м высказывался, afaik), но вы верите что оно так. Не сомневаетесь, не ищите - верите. Я потому и свернул с вами дискуссию, что не знаю как с религиозными людьми общаться.

После предположения Вами в такой оскорбительной форме, что я не знаю принципа научного скептицизма, про бремя утверждающего и про сомнения, я в не вижу никаких позитивных перспектив дискуссий с Вами в принципе.

Это Вы демонстрируете некомпетентность в области нейронных сетей («Любой из предложенных Dalle вариантов, это поиск в уже известных образах и усреднение с долей рандома»), непонимание того, что именно является сложным для них, а что не очень. Да и понятно, что если Вы просите дать статьи о принципах («А есть что-то быть может тут же на хабре или рядом почитать про детали и принципы работы таких нейронок?»), то Вы этих принципов не знаете.

Но незнание не мешает Вам делать необоснованные безапелляционные утверждения («конечно что-то другое», «не показывает ничего интересного, кроме пиара себя» «человеческое сознание, которое позволяет создавать отличающиеся от друг-друга вещи») именно что в религиозном духе (точно в таком же формате верующие утверждают, что у человека есть душа, которой не может быть у других животных, что свойства человека имеют другую природу, чем свойства технических систем и животных кроме человека).

В то время как я-то выразился как раз аккуратно, в научном духе («признаков… не просматривается.», «на мой взгляд, видно», «динамика прогресса… на мой взгляд, говорит за то», «динамика… даёт серьёзные основания предполагать»).

Простите, но Вы приписываете мне свои грехи.

Предлагаю Вам поразмыслить над этим. Но уже без меня. Adios!
Любой из предложенных Dalle вариантов, это поиск в уже известных образах и усреднение с долей рандома
Вовсе нет. Задача генерации, которую решают такие нейронки — это не интерполяционная задача. Такие нейронки занимаются экстраполяцией за пределы обучающей выборки (и именно это и есть креативность).
Можете воспринимать такую нейронку как поисковик по «вавилонской библиотеке» — она способна сгенерировать абсолютно любое теоретически возможное сочетание пикселей при правильном подборе параметров (запрос, температура, seed и т.д.).

А есть что-то быть может тут же на хабре или рядом почитать про детали и принципы работы таких нейронок?

Этот комментарий написан на сайте с типичным дизайном, в типичном поле ввода комментария с типичными кнопками.

По настоящему креативных людей - единицы. Не единицы на тысячу, не на миллион. На всех людей на планете, по настоящему креативных единицы.

Рисование умерло с того момента, когда краски и кисти смогло себе позволить большинство. Теперь это бесконечное повторение одного и того же в разных стилях.

И так во всём, вплоть до науки.

Только, в отличии от людей, нейросетка (пока только) рисует во много раз быстрее. Хотя читал, что сейчас и в химии нейросети применяются и даже что-то открывает новое.

99% дизайнеров этим и занимаются, но да, заменить тех реальных профессионалов которые достают образы из будущего безусловно никто не сможет.

Главное чтобы не выяснилось, что это, пока, прототип, а рисуют 100500 индусов за еду.
А , с другой стороны, так даже спокойнее.

Это должны быть очень заряженные индусы, чтобы по 4 пикчу в пару секунд с разными дизайном генерить.

ИИ не справился с парсингом явно заданной в кавычках строки (на первой же картинке)?
Понимаю. Скайнет откладывается.
Я бы на Вашем месте как раз наоборот боялся бы. Ведь гипотетическая проблема «Скайнета» не в том, что он будет умный, а в том, что он будет делать то, чего большинству из нас совсем не хочется!

Соответственно, не хотелось бы, чтобы он не справился с пониманием, и из-за этого стал бы массово убивать.

Просто Dalle*2 хуже генерит текст и типографику по сравнению с Imagen.