Comments 14
Сбор данных: данные берутся из открытого интернета, баз знаний, купленных книг и других источников.
Нейросетчиков уже ловят за руку что не "из открытых интернетов", а включая фото из медицинских изданий(которые вообще то разрешены к печати в конкретном издании в иллюстративных целях, а не к переиспользованию кем угодно, это никак не "открытые данные"), или от прямо запрещавших обучать на своём творчестве художников.
По факту нейросетчики учат на всём, что они сами обзовут "открытыми". Раскрывать же реальные источники они очень громко не хотят и старательно противятся поползновениям со стороны законодателей их заставить. Как высказался один фанат нейросеток на хабре "Мы берём эти "лицензии" и вытираем ими жопу.".
Обучение: нейросеть «запоминает» закономерности, стили, факты, но не запоминает конкретные строки.
А потому сетки упорно лепили вотермарки с превьюшек картинок из всяких стоков и копирайты из исходного кода. Тоже, кстати, в копилку реальных источников и юридической чистоты датасетов.
И заодно вопрос - если в коде "нагенерено"(то есть вставлено) кусков из GPL и какого-нибудь кода IBM/NVIDIA/AMD- то какая на этом коде в итоге лицензия? Про что-то такое в этой заметке ожидал увидеть, потому что интересный же вопрос.
Когда сетка сгенерила код, она его не использует. Использует его тот кто его получил.
Или когда в школе искусств, студенту показали картинку рембранта, он посмотрел на нее и сделал что то похожее, или не похожее. Это то же что ли кража прав?)
Сейчас llm не делают копипаст, оно под капотом, просто, работает совершенно по другому
Или когда в школе искусств, студенту показали картинку рембранта, он посмотрел на нее и сделал что то похожее, или не похожее. Это то же что ли кража прав?)
У человека нет в голове перемножения матриц весов комбинаций пикселей, и он их не высчитывает когда смотрит на картины; и даже намеренно повторяя чужую работу он не будет срисовывать вотермарку, потому что рисует не "часто встречающиеся вместе пиксели" - а понимает что есть рука, а есть котик, разделяет объекты, композицию, перспективу, материалы и техники исполнения. Вот если захочет именно вотермарке подражать - тогда её нарисует.
А когда человек именно что копирует, обводит, срисовывает, перерисовывает чужое - то в общем случае это судебно наказуемо. И для допустимого использования такого копирования там уйма ограничений. Повторять чужое для своего обучения - один из таких вариантов, и он тоже не про "а потом сижу и штампую современных-рембрантов-под-копирайтами на продажу не автором".
LLM по сути это попытка воспроизвести работу мозга, но на других физических принципах. Но суть та же, вероятностное прохождение сигнала через нейросеть. То что иногда LLM рисует вотермарку иногда, по ошибке, ничем не отличается от того что человек ее тоже может нарисовать, хотя его прямо об этом не просили.
Вы просто кажется не понимаете принцип работы нейросети. Она не делает копирование. Она использует вероятностные паттерны, если грубо. Как в общем то и человек. Что делает гениальной картину скажем Дали? В силу стечения обстоятельств, намеренно или не намеренно, он рисует условный портрет, внося в него те или иные фишки. Которые людям нравятся. Нейросеть, можно ровно также заставить, немного галлюцинировать, и на 1000 кривых попыток, одна будет прикольная, если она нравится большинству, ее просто фиксируем и она будет гениальным стилем. Кроме того, экспериментов куча есть, когда берут целевую группу, ей в закрытую дают послушать музыку которая считается шедевром, или картину показыаают... и обычный ширпотреб качественный противопоставляют... и львиная доля людей не выделяют шедевр.
LLM по сути это попытка воспроизвести работу мозга, но на других физических принципах
Да, но нет. Эта попытка основана на работе распознавания образов. Выдавать нейросетку за "совсем как человек это делает, ошибается, придумывает, поправляется" - прямая ложь. Обратную зависимость пытаться приписать(некоторые громкие неросеткофанаты любят) вида "но ведь человек как нейросетка списывает работы на них посмотрев" - ещё большая ложь.
И нет, она не "немного галлюционирует". Это прямой результат приницпов её работы - комбинация среднестатистических комбинаций элементов, распознанных в обучающем сете, по тегам из запроса, чуть подвинутая генератором случайных чисел чтоб не одно и то же всегда. Она всегда галлюционирует, просто чаще всего результат наш мозг дорабатывает как надо - и как замена ширпотреба она пойдёт. Мало кому режет глаз как шея переходит в тело змеи на календаре потому что пиксели чешуи там, пиксели чешуи там, а понятий кусков тела и их простанственного расположения нету; а люди спокойно "дорабатывают" недостатки "красиво же, ты чо, не обращай внимания, прогресс". Это тоже механизм мозга - достройка смыслов, приписывание смыслов, прилизывание не очень дёргающих(тут у всех разный уровень) ошибок.
Очеловечивание, наконец. "Собака-улыбака весёлая и добра", "хмурый котик хмур и грустит", "умная нейросетка понимает меня" - это всё приписанные человеком свойства на основе отдалённой внешней похожести на внешний вид/результат человеков, которых у объекта то и нет. У кого-то это остаётся на низком уровне "во как генерит, отлично придумано", кого-то через это заносит в "она одна меня понимает" шизу.
ее просто фиксируем и она будет
... комбинацией всё того же своего обучающего набора. Без наличия в нём работ определённого художника с достаточно своим стилем - она не будет делать имитацию работ этого художника. В лучшем случае можно будет подобрать каких-то близки. Без наличия в обучении работ супрематизма, кубизма, абстракционизма - не создаст супрематизма, кубизма, абстракционизма. Потому что это не банальное переставление кусков предыдущих работ. Да и между египетской живописью, греко-римской и ренессансовой какой знатная разница, не выводимая комбинацией. Там, например, перспектива появилась в процессе, да разная. В сетках её нигде нету.
И даже пальцы она не переставит, потому что там нет такого понятия внутри, совсем нету. Перегенерит картинку на основе дополненных токенов из запроса с новым броском кубиков генератором случайных чисел - да.
Вы же не будете калейдоскоп выдавать за "совсем как мозг"? Тоже комбинирует на базе случайности, тоже человек может результат оценить как "красивое, надо зафиксировать и передать другим". Разве что матриц для этого не перемножает.
Чем распознавание образов машиной на основе модели, отличается принципиально от распознавания образа мозгом человека?) Суть ровно такая же, выделение базовых точек мозгом, определение взаимосвязей между ними. Типичнейшая история когда человек что то увидел, а потом "а нет, показалось". Есть медицинский факт, что сейчас машина распознает образы лучше чем человек, процент ошибок гораздо меньше, скорость работы выше.
Калейдоскоп отличается от создания картины человеком или генеративкой тем, что в калейдоскопе картинка условно произвольная, ограничено гравитцией и стекляшками которые в нем доступны. А рисование картины это процесс с граничными условиями, когда есть критерий "понравится человеку".
И когда идет речь о "случайности" в контексте нейронок, это не случайность калейдоскопа, это случайность отдельного "нейрона" (узла нейронки) и случайность перехода между ними.
Что мозг что нейронка, повторюсь, работают по идентичному принципу, по сути. В процессе обучения между нейронами в мозге или между узлами сети в нейросети, закрепляются вероятности перехода от текущего узла-нейрона, к соседнему. В случае нейронки вероятность считается математически, в случае мозга вероятность определяется синаптическими связями и переходом сигнала через синаптическую щель.
И да если вы попросите нейронку нарисовать картину не используя существующие стили, она это сделает, без проблем. А потом если сгенеренное будет прикольно можно это назвать "нью-бум-артом" и просить генерить картины в подобном стиле)
Сейчас у ии проблема не в "умности", а в том что интерфейсы взаимодействия с внешним миром, которые обладают обратной связью.....оооочень сильно отстают от нейронок. Поэтому пока малореально сделать робота сантехника, это не "мозг" не осилит замену унитаза, а "тушки" нет, которая под управлением ии, способна поднявшись на 5й этаж хрущевки, протиснувшись в крохотный санузел в малопонятной позиции снять старый, и поставить новый.
Чем распознавание образов машиной на основе модели, отличается принципиально от распознавания образа мозгом человека?
Тем, что это именно распознование образов. То есть другая область относительно генерации образов и их последующего мысленного редактирования. Человек понимает что он хочет руку - и он прикидывает какую, какие ограничения, какой материал нужен.
Нейросетка складывает пиксели "рука". Иногда они оказываются одинаковыми с пикселями "волосы".
Что мозг что нейронка, повторюсь, работают по идентичному принципу, по сути.
А "птица работает по идентичному реактивному лайнеру принципу".
То есть - нет. Это подмена. Есть схожие общие принципы, но даже с их близостью вопросы. А так буквально разные вещи, в случае летающих обеспеченные атмосферой и физикой, а для творчества - форматом хранения/создания произведения и свойствами материалов. У птиц будет парение на ветру больше, чем махать постоянно, у лайнера крутить турбину для создания тяги; кроме подъёмной силы ничего общего, даже профиль крыла. У художника цифрового на выходе будут пиксели, и у нейросетки будут пиксели. И даже на входе будут пиксели, если дать образец цифровой. Но в середине между входом и выходом разное, потому что пока одно матрицы считает и рисует 6 пальцев, другой объектами в воображении манипулирует, понимая какие где пальцы, почему так, и как они под этим углом видны. И может отредактировать, чуть подвинуть; а не "перегенерить пиксели снова".
И да если вы попросите нейронку нарисовать картину не используя существующие стили, она это сделает
Без супрематизма в обучающей выборке она не сделает супрематизм. Там просто нету внутри ничего, что создает несуществующее в выборке. Рекомбинации даёт, а новое - нет.
Рекомбинации даёт, а новое - нет.
большинство людей не способны даже дать рекомбинации. более того, принципиально новое даже не всякому гению по силам создать, и хватит уже приписывать гениальность отдельных людей всему человечеству
нейросеть рисует по 6 пальцев потому что она руки видела только на картинках. она не умеет в 3д мир. это человеческий художник обучался на живых референсах и понимает анатомию. крч это разница в методах, или если хотите алгоритмах обучения. а вовсе не в принципах работы самих биологических и программных нейросетей и их функциональности
большинство людей не способны даже дать рекомбинации.
Подтверждения на полную неспособность к рекомбинации "большинства людей" - будут? Потому что примерно все люди в детстве проходят творческую фазу и пытаются рисовать чем угодно на чём угодно.
и хватит уже приписывать гениальность отдельных людей всему человечеству
У нейросетей в принипе нету чего-то кроме рекомбинации на основе входного сета. Поэтому аргумент "не все люди такое сделали/могут сделать" - ложен в своей сути, это всё равно больше нуля процентов у сеток. И пока человек такого не сделал и по нему не обучили сетку - то и сетка такое не может.
крч это разница в методах, или если хотите алгоритмах обучения. а вовсе не в принципах работы самих биологических и программных нейросетей и их функциональности
Вы пытаетесь редуцировать до "это у человека как у нейросетей".
все верно, инстиут авторского права давно уже пора разрушить.
Если не согласны, сначала погуглите про авторские права нинтендо на игровые механики. Это полнейший бред.
А сколько 3D-печатников встряло на большие деньги, по незнанке выставляя на продажу запатентованные модели
ну с продажей чего-то напечатанного по запатентованным моделям я может ещё готов как-то оправдывать
но когда люди делают сами игру, сами делают механику, что забегая за укрытие, у тебя фигурка персонажа обводится цветным контуром типа ты видишь насквозь и потом внезапно им прилетает иск, вот это как по мне за гранью человеческого находится
поддерживаю!
Как ИИ ломает систему авторских прав: технические детали и будущее творчества