Comments 47
Не совсем, позвольте дополнить ваш комментарий. Если говорить о ЕГЭ-шном формате эссе, то там крайне жесткая структура. Можно буквально по трафарету его писать (из-за чего я не считаю, что эссе на ЕГЭ подобием сочинений). В 10-11 классе гоняют преимущественно по такому формату. Поэтому, когда говорят о эссе, то все-таки в ру-сегменте есть структура, когда речь о сочинении, то жесткой структуры нет (и не должно быть)
Учителя на полном серьёзе дают целые фразы ("клише"), преимущественно канцеляритные, предлагая/требуя копировать их в сочинения дословно
По моему впечатлению, канцелярита там нет, он даже критикуется. Но отдельные фразы, конечно, шаблонные. С другой стороны, это упрощает работу, поскольку даёт "каркас" текста. А вот приводить аргументы и составлять остальной текст всё же нужно из своей головы. Так что, кмк, егэшные сочинения не так плохи.
Их ещё критикуют за необходимость соглашаться с тезисом (это как бы необязательно, но в случае несогласия у тебя должна быть развита мысль и речь на уровне Толстого). Но, с другой стороны, тезисы там вполне соглашательские, типа "за общечеловеческие ценности", кроме того, это ж просто задание.
Gptchat достаточно неплохой ассистент, я его использую для получения черновика некоторых текстов, так же он неплохо помогает с решении небольших проблем в коде и даже комментирует свои правки, но это тоже именно черновик. Так же он не плох как тренажёр для изучения языка, с ним можно "играть" в задачи по грамматике, во всяком случае английской.
Но я его ловил на "придумывании" фактов. При это придуманные "данные" были весьма правдоподобны, но не существовали в реальности. Например я пытался его использовать для поиска рассказа по автору и сюжету. Он мне выдал не существующий рассказ, написал имена его главных героев, вполне в духе автора и аннотацию к сюжету, примерно как в книгах на обратной обложке. Все это выглядело как ответ на вопрос от очень продвинутого поисковика, именно то, что мне было нужно, за исключением одной детали, рассказ с таким сюжетом у автора есть и я потом нашел, пролистав книгу сборник, а вот рассказа из ответа gptchar у автора нет.
Дак это ведь искусственный интеллект, а не поисковик. Естественному интеллекту тоже свойственно придумывать всякую ботву)
Аккуратнее с грамматикой. Я специально пробовал заставлять его писать тесты по грамматике, а затем проверять мои ответы. Ошибок при проверке с его стороны было предостаточно. Возможно, если делать это не в формате тестов, придумать какой-то более интересный запрос, то оно и сработает, но я пристально этот вопрос не изучал.
На волне общего всплеска интереса к генераторам изображений казалось, что это какое-то чудо, портал в мир волшебства и бесконечного креатива, но со временем абсурдно-бессмысленные детали изображения натренировали глаз почти безошибочно видеть генерацию и интерес угас настолько, что я просто удалил с компа SD.
Без всяких сомнений эти инструменты пригодятся во многих применениях, но вот узнаваемость результата быстро приелась и художникам и зрителям.
Да, генераторы нещадно врут в деталях - количество пальцев, узоры, надписи, прочие мелкие детали выдают их с головой.
Недавно начинающая эйчарка похвасталась, как она ловко сделала описание вакансии с помощью ChatGPT (типа это будущее и всё такое, слава роботам - разогнать всех человеков) - после показа пальцем на несколько грубых нестыковок в требованиях (банально - опыт 5 лет в технологии, которой и года ещё нет) энтузиазм поубавился.
Кстати, да, тоже после ряда генераций SD начал интуитивно распознавать большое число картинок, сгенерированных подобных образом - и тоже интерес к ним в целом угас.
3D-графика тоже очень узнаваема - сразу понятно, что это рендер, а не рисунок. И дефектов хватает вроде вечного мыльца, перетемнённой картинки и шестиугольных колёс. С расстановкой пальцев, кстати, тоже там не всё гладко - то самопересечения, то неестественные позиции. К тому же SFM-рендеры намного более однообразны, чем выхлоп SD. Однако это не мешает 3D, причём в наиболее примитивном виде (DAZ и SFM) пользоваться огромной популярностью.
Сравнили результат работы алгоритма и результат работы человека в определённой технике. К тому же, всё что вы перечислили проблемы не 3Д графики, а моделлера, который не может в фотореализм. А вот пример работы того, кто может:
Так 3D тоже строится по алгоритму. Причём оно ближе скорее к коллажированию, чем к собственно рисованию. Как правило, берутся готовые ассеты и из них всё собирается. Сами что-то лепят очень немногие, и даже они потом текстуры берут готовые.
К тому же, всё что вы перечислили проблемы не 3Д графики, а моделлера, который не может в фотореализм
Так и проблемы SD-генерации отлично решаются человеком, который знает, как всё это работает и как поправить основные косяки модели. Там при желании можно вообще Pixel Perfect получать, генерируя по областям и миксуя результаты генераций через ControlNet.
Для меня, человека всю взрослую жизнь занимающегося 3Д ваши рассуждения выглядят просто нелепой попыткой натянуть аналогию на глобус. Ну тогда и традиционное рисование тоже работа по алгоритму и написание текстов, чего мелочиться.
Вы просто недооцениваете степень влияния человека на процесс SD-генерации. Когда генерация сводится к тому, чтобы вбить некий запрос и нажать одну кнопку - то и результат примерно как от скачивания готовых ассетов для DAZ и нажатия клавиши Render.
Но возможностей в современных SD-фреймворках ничуть не меньше, чем в современном 3D-редакторе. И рефы можно использовать, и собирать композицию из предварительно сгенерированных деталей, и редактировать ранее созданное, и использовать данные OpenPose для генерации персонажей в заданных позах, и использование сегментационной разметки, и мощный скриптовый движок есть с возможностью создания плагинов, и рендер/обработка видео, и куча прочего, что осваивать не один месяц.
Генерация 3D (obj+текстуры на выходе) тоже кстати начинает появляться, хоть пока что конкретно в этом направлении результаты и очень слабые.
Я за SD просидел почти месяц ежедневно в какие-то дни по 12 часов только им занимался, прекрасно представляю на что он способен и как сложно заставить его сделать задуманное.
Вы сравниваете несравнимое, для меня это выглядит как рассуждения человека "теоретика", знающего вопрос лишь по чужим статьям.
Эти генераторы слепые подражатели, лепящие что-то среднее из того датасета, на котором их учили. Сделать что-то осмысленное и принципиально новое они неспособны. Пока что они даже самолёт не могут нарисовать, выдавая бредятину типа:
Но вот пейзажи генерирует хорошо, тут не прикопаешься.
Ну а кто сказал, что генерировать надо непременно весь объект целиком и с шансом 100%? Делаем пачку в 20 картинок, выбираем примерно подходящее, далее требуем перерисовать проблемные области.
К тому же можно вообще взять штук десять рефов с картинками самолёта, сгенерировать из них эмбеддинг и всё станет
намного проще
Есть кстати и специализированные SD-модели для генерации той или иной техники, которые работают намного лучше общей универсальной модели.
Ну и результат — кривой. Как я изначально и говорил, что детали получаются кривые и бессмысленные.
Все эти танцы с бубном и допилки в совокупности оказываются дольше и трудозатратнее чем взять и смоделлить руками с нуля.
Дольше - кому? Профессиональному моделлеру с многолетним опытом?
Потому что я вот, к примеру, не смогу получить рендер самолёта с нуля из 3D-редактора как на картинке выше ни за 15 минут, ни за час, ни даже за три часа.
И моделлер, впервые увидевший 3D-редактор всего три месяца назад, тоже не сможет. А вот уже через месяц обучения работе с SD - вполне.
А теперь сюрприз - спецов с опытом работы с SD хотя бы год не существует. Вообще. Просто потому, что вышла она только в августе 2022, а до ума её довели ещё позже.
Вот года через два, как наработаются основные практики и появится куча "ассетов" в виде специализированных моделей/эмбеддингов, а также людей с реальным опытом работы, и посмотрим, что будет проще, быстрее и дешевле. Заодно через эти два года и сами генеративные сети ощутимо продвинутся.
Я еще более восторженным был чем вы когда изучал SD, но когда дошло до практических задач это всё оказалось люто неуправляемой фигнёй.
Для интереса попробуйте сделать простейший эксперимент, который я предлагаю всем, кто расхваливает эти генераторы. Создайте запросами простейший комикс состоящий из семьи из трёх человек, которые идут по лесу и разговаривают. Так, чтобы минимум четыре слайда и на каждом был изображен разный персонаж семьи, а на одном из них все трое вместе. Я трое суток просидел над этой задачей и не получилось даже двух кадров сделать, чтобы там были одни и те же персонажи в сходной одежде.
Вот попробуйте, потом поговорим. Это же так просто!
Если пытаться получать по целому кадру с запроса, то миссия действительно практически невыполнима (разве что сгенерить 10000 рисунков и выбрать из них подходящий).
Но ведь это всё равно что требовать от 3D-моделлера, чтобы вся сцена была сделана сразу одним мешем и в одну текстуру!
Задача с генерацией комикса решается разделением на части. Сперва генерируется каждый из трёх персонажей отдельно, потом в них вносятся вариации (позы, выражения лиц под каждый кадр). Далее генерируются фоны. А затем всё это собирается/склеивается с убиранием стыков той же нейронкой.
3Д моделлер сразу будет делать симметричный самолёт, потому что есть модификатор mirror. А потом получится модель самолёта такая, что её можно вписывать в любое освещение, ставить под любым ракурсом и она не изменит форму и не вырастут новые детали.
Нейросеть это слабоуправляемая галлюцинация, которая понятия не имеет о том что она рисует и каждый новый кадр она перерисовывает заново.
Я не понимаю почему вы так за неё топите, когда эти штуки неспособны нарисовать не то что один объект с разного ракурса, они не могут одну и ту же картинку повторить.
Спасибо за интересный пример (с 3D тоже).
У меня вот две мысли:
1. Нейросети полезны тем, кто хочет скреативить "для себя", но умеет в конкретную область почти никак (читай: хочу нарисовать свою вайфу самолет, но ни рук, ни знания 3D)
2. Насчет работы "для других" (т.е. профессиональной) мы натыкаемся на интересной жизненный вопрос - проще ли сделать "с нуля", или поправить неочевидные ошибки в созданном?
Через голову знаком с аниматоркой, которая использовала нейросеть для создания клипа по техпроцессу "3Д оснастка с простой анимированной моделью --> рендер в секвенцию картинок --> прогон этой секвенции в SD img-to-img.
В итоге получилось ожидаемое, каждый кадр анимации чем-то да отличается от предыдущего из за чего образуется эффект дрожания картинки. Как они её ни пытались заставить рисовать похожее но эффект не побороли.
По-моему самое верное применение нейросеток на их текущем этапе развития это генерация эскизов. Статичных изображений по описанию для последующей переделки (если оно требуется). Или как помощник художнику в качестве роботизированного "подмалёвщика", например когда требуется быстро изобразить общий вид изображения, создать рефренсы (образцы) для заказчика, или же зарисовать какие-то рутинные участки изображения, где требуется много действий, но не требуется достоверность или повторяемость. Например, нарисовать толпу на стадионе.
Возможно в будущем эти инструменты разовьются и потеснят многих с рынка. Но пока что первоначальный энтузиазм и "вау-эффект" спал и стало очевидным множество ограничений нейросеточных алгоритмов рисующих изображения.
midjourney достаточно прикольно рисует, лучше чем sd
SD, как и ChatGPT, лишь инструменты. Очевидно что результаты их работы нужно дорабатывать другими инструментами (тем же фотошопом) или вручную.
что эссе, посвященное критике одной из работ Джудит Батлер, было резким, лязгающим
Статья тоже сгенерирована ChatGPT?
"В этом случае он сразу увидит, что эссе не сделано собственноручно впавшим в панику студентом за час до крайнего срока, а чат-ботом, который не понимает, что фантазии в этой работе неуместны" - похоже на артефакты автоперевода, пропущеные впавшим в панику за час до срока копирайтером.
Скоро институт для оптимизации расходов доверит проверку эссэ студентов чат-боту. После этого все эссе сгенерированные чат-ботом будут полностью проходить все проверки.
Представляете вы приходите на работу, а новый начальник, которого по странному стечению обстоятельств никто лично не видел. Издает приказ, который имеет синтаксическую связность, но при этом не несёт никакого смысла. Есть над чем задуматься.
Местами похоже, что текст этого поста написан с помощью ChatGPT
Все эти нейросетевые вероятностные модели хороши как инструменты, и это действительно прорыв. Но все же, нужно развивать и семантические/"символьные" подходы.
Это как раз то, почему нынешние ИИ это на самом деле не ИИ
Ну, тут стоит ругать не чатбот, а её операторов (студентов) за их бездарный подход в написании, в конкретном случае, эссе. С помощью чатбота ускорить написание полотна текста - абсолютно реально, но перебарщивать (т.е. полностью положиться на него) я бы не советовал. Имхо, с формулированием структуриронного текста с заранее чётко заданной инфой он справляется на ура
ChatGPT настолько плох в написании эссе, что преподаватели почти сразу замечают отсутствие смысла в тексте при проверке