Pull to refresh

Comments 47

UFO just landed and posted this here

Не совсем, позвольте дополнить ваш комментарий. Если говорить о ЕГЭ-шном формате эссе, то там крайне жесткая структура. Можно буквально по трафарету его писать (из-за чего я не считаю, что эссе на ЕГЭ подобием сочинений). В 10-11 классе гоняют преимущественно по такому формату. Поэтому, когда говорят о эссе, то все-таки в ру-сегменте есть структура, когда речь о сочинении, то жесткой структуры нет (и не должно быть)

Про сочинения на русском (и, возможно, на английском) под российский ЕГЭ (а других старше 8 класса там и нет). Учителя на полном серьёзе дают целые фразы ("клише"), преимущественно канцеляритные, предлагая/требуя копировать их в сочинения дословно. В начале каждой части, в конце каждой части, где ещё удобно.

Учителя на полном серьёзе дают целые фразы ("клише"), преимущественно канцеляритные, предлагая/требуя копировать их в сочинения дословно

По моему впечатлению, канцелярита там нет, он даже критикуется. Но отдельные фразы, конечно, шаблонные. С другой стороны, это упрощает работу, поскольку даёт "каркас" текста. А вот приводить аргументы и составлять остальной текст всё же нужно из своей головы. Так что, кмк, егэшные сочинения не так плохи.

Их ещё критикуют за необходимость соглашаться с тезисом (это как бы необязательно, но в случае несогласия у тебя должна быть развита мысль и речь на уровне Толстого). Но, с другой стороны, тезисы там вполне соглашательские, типа "за общечеловеческие ценности", кроме того, это ж просто задание.

UFO just landed and posted this here

Gptchat достаточно неплохой ассистент, я его использую для получения черновика некоторых текстов, так же он неплохо помогает с решении небольших проблем в коде и даже комментирует свои правки, но это тоже именно черновик. Так же он не плох как тренажёр для изучения языка, с ним можно "играть" в задачи по грамматике, во всяком случае английской.

Но я его ловил на "придумывании" фактов. При это придуманные "данные" были весьма правдоподобны, но не существовали в реальности. Например я пытался его использовать для поиска рассказа по автору и сюжету. Он мне выдал не существующий рассказ, написал имена его главных героев, вполне в духе автора и аннотацию к сюжету, примерно как в книгах на обратной обложке. Все это выглядело как ответ на вопрос от очень продвинутого поисковика, именно то, что мне было нужно, за исключением одной детали, рассказ с таким сюжетом у автора есть и я потом нашел, пролистав книгу сборник, а вот рассказа из ответа gptchar у автора нет.

Дак это ведь искусственный интеллект, а не поисковик. Естественному интеллекту тоже свойственно придумывать всякую ботву)

Это не интеллект, это стохастический попугай. Понятие истинности и вообще факта в его модели отсутствует.

Вы слишком хорошего мнения об интеллектах. Не всякий интеллект ищет истинность.

Понятие истинности и вообще факта в его модели отсутствует.

Можно подумать, в естественном интеллекте как-то по-другому)

Аккуратнее с грамматикой. Я специально пробовал заставлять его писать тесты по грамматике, а затем проверять мои ответы. Ошибок при проверке с его стороны было предостаточно. Возможно, если делать это не в формате тестов, придумать какой-то более интересный запрос, то оно и сработает, но я пристально этот вопрос не изучал.

На волне общего всплеска интереса к генераторам изображений казалось, что это какое-то чудо, портал в мир волшебства и бесконечного креатива, но со временем абсурдно-бессмысленные детали изображения натренировали глаз почти безошибочно видеть генерацию и интерес угас настолько, что я просто удалил с компа SD.

Без всяких сомнений эти инструменты пригодятся во многих применениях, но вот узнаваемость результата быстро приелась и художникам и зрителям.

Да, генераторы нещадно врут в деталях - количество пальцев, узоры, надписи, прочие мелкие детали выдают их с головой.

Недавно начинающая эйчарка похвасталась, как она ловко сделала описание вакансии с помощью ChatGPT (типа это будущее и всё такое, слава роботам - разогнать всех человеков) - после показа пальцем на несколько грубых нестыковок в требованиях (банально - опыт 5 лет в технологии, которой и года ещё нет) энтузиазм поубавился.

банально — опыт 5 лет в технологии, которой и года ещё нет

Так это тебе и живой HR напишет. Нам нужен мидл на технологию ХХХ. Ага, в вакансию пишем XXX, мидл значит от 3 лет опыта.

Хотел зажигательно пошутить про мидл и XXX, но не стал.

Кстати, да, тоже после ряда генераций SD начал интуитивно распознавать большое число картинок, сгенерированных подобных образом - и тоже интерес к ним в целом угас.

3D-графика тоже очень узнаваема - сразу понятно, что это рендер, а не рисунок. И дефектов хватает вроде вечного мыльца, перетемнённой картинки и шестиугольных колёс. С расстановкой пальцев, кстати, тоже там не всё гладко - то самопересечения, то неестественные позиции. К тому же SFM-рендеры намного более однообразны, чем выхлоп SD. Однако это не мешает 3D, причём в наиболее примитивном виде (DAZ и SFM) пользоваться огромной популярностью.

Сравнили результат работы алгоритма и результат работы человека в определённой технике. К тому же, всё что вы перечислили проблемы не 3Д графики, а моделлера, который не может в фотореализм. А вот пример работы того, кто может:

Так 3D тоже строится по алгоритму. Причём оно ближе скорее к коллажированию, чем к собственно рисованию. Как правило, берутся готовые ассеты и из них всё собирается. Сами что-то лепят очень немногие, и даже они потом текстуры берут готовые.

К тому же, всё что вы перечислили проблемы не 3Д графики, а моделлера, который не может в фотореализм

Так и проблемы SD-генерации отлично решаются человеком, который знает, как всё это работает и как поправить основные косяки модели. Там при желании можно вообще Pixel Perfect получать, генерируя по областям и миксуя результаты генераций через ControlNet.

Для меня, человека всю взрослую жизнь занимающегося 3Д ваши рассуждения выглядят просто нелепой попыткой натянуть аналогию на глобус. Ну тогда и традиционное рисование тоже работа по алгоритму и написание текстов, чего мелочиться.

Вы просто недооцениваете степень влияния человека на процесс SD-генерации. Когда генерация сводится к тому, чтобы вбить некий запрос и нажать одну кнопку - то и результат примерно как от скачивания готовых ассетов для DAZ и нажатия клавиши Render.

Но возможностей в современных SD-фреймворках ничуть не меньше, чем в современном 3D-редакторе. И рефы можно использовать, и собирать композицию из предварительно сгенерированных деталей, и редактировать ранее созданное, и использовать данные OpenPose для генерации персонажей в заданных позах, и использование сегментационной разметки, и мощный скриптовый движок есть с возможностью создания плагинов, и рендер/обработка видео, и куча прочего, что осваивать не один месяц.

Генерация 3D (obj+текстуры на выходе) тоже кстати начинает появляться, хоть пока что конкретно в этом направлении результаты и очень слабые.

Я за SD просидел почти месяц ежедневно в какие-то дни по 12 часов только им занимался, прекрасно представляю на что он способен и как сложно заставить его сделать задуманное.

Вы сравниваете несравнимое, для меня это выглядит как рассуждения человека "теоретика", знающего вопрос лишь по чужим статьям.

Эти генераторы слепые подражатели, лепящие что-то среднее из того датасета, на котором их учили. Сделать что-то осмысленное и принципиально новое они неспособны. Пока что они даже самолёт не могут нарисовать, выдавая бредятину типа:

Но вот пейзажи генерирует хорошо, тут не прикопаешься.

Ну а кто сказал, что генерировать надо непременно весь объект целиком и с шансом 100%? Делаем пачку в 20 картинок, выбираем примерно подходящее, далее требуем перерисовать проблемные области.

К тому же можно вообще взять штук десять рефов с картинками самолёта, сгенерировать из них эмбеддинг и всё станет

намного проще

Есть кстати и специализированные SD-модели для генерации той или иной техники, которые работают намного лучше общей универсальной модели.

Ну и результат — кривой. Как я изначально и говорил, что детали получаются кривые и бессмысленные.

Все эти танцы с бубном и допилки в совокупности оказываются дольше и трудозатратнее чем взять и смоделлить руками с нуля.

Дольше - кому? Профессиональному моделлеру с многолетним опытом?

Потому что я вот, к примеру, не смогу получить рендер самолёта с нуля из 3D-редактора как на картинке выше ни за 15 минут, ни за час, ни даже за три часа.

И моделлер, впервые увидевший 3D-редактор всего три месяца назад, тоже не сможет. А вот уже через месяц обучения работе с SD - вполне.

А теперь сюрприз - спецов с опытом работы с SD хотя бы год не существует. Вообще. Просто потому, что вышла она только в августе 2022, а до ума её довели ещё позже.

Вот года через два, как наработаются основные практики и появится куча "ассетов" в виде специализированных моделей/эмбеддингов, а также людей с реальным опытом работы, и посмотрим, что будет проще, быстрее и дешевле. Заодно через эти два года и сами генеративные сети ощутимо продвинутся.

Я еще более восторженным был чем вы когда изучал SD, но когда дошло до практических задач это всё оказалось люто неуправляемой фигнёй.

Для интереса попробуйте сделать простейший эксперимент, который я предлагаю всем, кто расхваливает эти генераторы. Создайте запросами простейший комикс состоящий из семьи из трёх человек, которые идут по лесу и разговаривают. Так, чтобы минимум четыре слайда и на каждом был изображен разный персонаж семьи, а на одном из них все трое вместе. Я трое суток просидел над этой задачей и не получилось даже двух кадров сделать, чтобы там были одни и те же персонажи в сходной одежде.

Вот попробуйте, потом поговорим. Это же так просто!

Если пытаться получать по целому кадру с запроса, то миссия действительно практически невыполнима (разве что сгенерить 10000 рисунков и выбрать из них подходящий).

Но ведь это всё равно что требовать от 3D-моделлера, чтобы вся сцена была сделана сразу одним мешем и в одну текстуру!

Задача с генерацией комикса решается разделением на части. Сперва генерируется каждый из трёх персонажей отдельно, потом в них вносятся вариации (позы, выражения лиц под каждый кадр). Далее генерируются фоны. А затем всё это собирается/склеивается с убиранием стыков той же нейронкой.

3Д моделлер сразу будет делать симметричный самолёт, потому что есть модификатор mirror. А потом получится модель самолёта такая, что её можно вписывать в любое освещение, ставить под любым ракурсом и она не изменит форму и не вырастут новые детали.

Нейросеть это слабоуправляемая галлюцинация, которая понятия не имеет о том что она рисует и каждый новый кадр она перерисовывает заново.

Я не понимаю почему вы так за неё топите, когда эти штуки неспособны нарисовать не то что один объект с разного ракурса, они не могут одну и ту же картинку повторить.

они не могут одну и ту же картинку повторить
Могут, если использовать один и тот же сид в ГПСЧ каждый раз.

Я некорректно выразился, повторить — перерисовать существующую со слегка другого ракурса.

Спасибо за интересный пример (с 3D тоже).

У меня вот две мысли:

1. Нейросети полезны тем, кто хочет скреативить "для себя", но умеет в конкретную область почти никак (читай: хочу нарисовать свою вайфу самолет, но ни рук, ни знания 3D)
2. Насчет работы "для других" (т.е. профессиональной) мы натыкаемся на интересной жизненный вопрос - проще ли сделать "с нуля", или поправить неочевидные ошибки в созданном?

  1. Через голову знаком с аниматоркой, которая использовала нейросеть для создания клипа по техпроцессу "3Д оснастка с простой анимированной моделью --> рендер в секвенцию картинок --> прогон этой секвенции в SD img-to-img.

В итоге получилось ожидаемое, каждый кадр анимации чем-то да отличается от предыдущего из за чего образуется эффект дрожания картинки. Как они её ни пытались заставить рисовать похожее но эффект не побороли.

По-моему самое верное применение нейросеток на их текущем этапе развития это генерация эскизов. Статичных изображений по описанию для последующей переделки (если оно требуется). Или как помощник художнику в качестве роботизированного "подмалёвщика", например когда требуется быстро изобразить общий вид изображения, создать рефренсы (образцы) для заказчика, или же зарисовать какие-то рутинные участки изображения, где требуется много действий, но не требуется достоверность или повторяемость. Например, нарисовать толпу на стадионе.

Возможно в будущем эти инструменты разовьются и потеснят многих с рынка. Но пока что первоначальный энтузиазм и "вау-эффект" спал и стало очевидным множество ограничений нейросеточных алгоритмов рисующих изображения.

Кстати, новость-топикстартер интересна именно тем, что, по-видимому, схожие эффекты достигаются и в текстовой генерации. Вначале вау-эффект, а потом, после насмотренности: "мы это уже видели" и "да тут много мелких ошибок и нет смысла".

UFO just landed and posted this here
midjourney достаточно прикольно рисует, лучше чем sd

SD, как и ChatGPT, лишь инструменты. Очевидно что результаты их работы нужно дорабатывать другими инструментами (тем же фотошопом) или вручную.

Эти нейросетки очень хороши для создания концептов и раскадровок, когда нужно что-то изобразить быстро, передать общее настроение и свет в кадре. Эдакий роботизированный концептер и скетчер.

что эссе, посвященное критике одной из работ Джудит Батлер, было резким, лязгающим

Статья тоже сгенерирована ChatGPT?

Нет, там так ближе всего к переводу — добавил в текст пояснение.

"В этом случае он сразу увидит, что эссе не сделано собственноручно впавшим в панику студентом за час до крайнего срока, а чат-ботом, который не понимает, что фантазии в этой работе неуместны" - похоже на артефакты автоперевода, пропущеные впавшим в панику за час до срока копирайтером.

Скоро институт для оптимизации расходов доверит проверку эссэ студентов чат-боту. После этого все эссе сгенерированные чат-ботом будут полностью проходить все проверки.

Представляете вы приходите на работу, а новый начальник, которого по странному стечению обстоятельств никто лично не видел. Издает приказ, который имеет  синтаксическую связность, но при этом не несёт никакого смысла. Есть над чем задуматься.

У меня от реальных законов/постановлений/инициатив нередко такое ощущение возникает...

Местами похоже, что текст этого поста написан с помощью ChatGPT

Все эти нейросетевые вероятностные модели хороши как инструменты, и это действительно прорыв. Но все же, нужно развивать и семантические/"символьные" подходы.

Это как раз то, почему нынешние ИИ это на самом деле не ИИ

Ну, тут стоит ругать не чатбот, а её операторов (студентов) за их бездарный подход в написании, в конкретном случае, эссе. С помощью чатбота ускорить написание полотна текста - абсолютно реально, но перебарщивать (т.е. полностью положиться на него) я бы не советовал. Имхо, с формулированием структуриронного текста с заранее чётко заданной инфой он справляется на ура

Sign up to leave a comment.

Other news