Pull to refresh

Comments 33

Интересно, а когда белковый сценарист что-то творит на основе прочитанного ранее - это тоже плагиат?

Это постмодернизм.

Большинство гуманитариев слишком обожествляет человеческое творчество и реально верит, что они создают нечто абсолютно новое, никак не вытекающее из ранее известного и не сводимое к комбинации уже известных элементов.

Профсоюз уточнил, что текст, полностью написанный искусственным интеллектом, следует считать плагиатом, поскольку в таком случае используются уже существующие материалы, защищённые авторским правом.

Так ведь нейронку вполне можно обучить и на полностью Public Domain-текстах. Как только давление со стороны копирастов достигнет некоторого критического уровня, такие нейронки неизбежно появятся.

UFO just landed and posted this here
ведь нейронку вполне можно обучить и на полностью Public Domain-текстах

Если мне нужно 10000 полноценных романов по 200+ страниц, и чтобы каждый в Public Domain, где их можно найти?

Тогда вам придётся найти другую архитектуру нейронки либо другой способ обучения. Например, сперва обучать на каком-нибудь свободном корпусе, в который входят вообще все PD-тексты, а потом уже тюнить на небольшом количестве доступных романов. Или шаманить с аугментацией данных.

Если мне нужно 10000 полноценных романов по 200+ страниц, и чтобы каждый в Public Domain, где их можно найти?

Google в свое время отсканировал 25 миллионов книг, но правообладатели воспрепятствовали тому, что бы все желающие получили к коллекции доступ. Причем Google планировал отсканировать почти все книги в мире, и собирался выплачивать вознаграждение авторам книг (или наследникам, если книга еще не перешла в общественное достояние), и даже самостоятельно искать правообладателей, если неочевидно кто владеет правами на старую книгу.

.... В библиотеке? Разве авторское право не истекает с течением времени? Возможно я что-то путаю, но мне кажется в 19м веке было много интересных работ.

Я думаю, количество книг со временем растёт по экспоненте. И если взять только книги, которые по времени попали в общественное достояния (70 лет со смерти автора), там будут буквально десятки или сотни романов. Маловато, чтобы обучить сеть на 100 триллионов параметров ))

Один только Feedbooks предлагает 80000 "свободных" книг.

Из них овердофига non-fiction, т.е. не худ. лит.
Наверное, можно что-то понадёргать, но книг не очень много
public domain / short stories = 1769,
public domain / sci-fi = 1138,
public domain / action = 322,
public domain / mystery & detective = 251,
public domain / fantasy = 171,
public domain / romance = 167,
public domain / horror = 144,
public domain / westerns = 116
Ткнул в рандомную книгу из fantasy, получил рассказ на 80кб.

Я взял fiction как фильтр и мне выдало 150к книг на английском. На всех языках выдаёт 500к книг.


И если книги не в public domain, то это не значит что их нельзя использовать. То есть есть книги и со "свободными лицензиями".

Ну а коли серьёзно, то что бы они не сказали по этому поводу, от них не ожидается ни нейтральности, ни научной честности.

поскольку в таком случае используются уже существующие материалы, защищённые авторским правом.

Или материалы, находящиеся в публичном доступе. Тоже не исключено.

И если кто-то считает что используются именно уже существующие материалы, защищённые авторским правом., то настолько я знаю ему это сначала надо доказать.

И суд будет обязывать предоставлять базы, использованные для обучения. И обман суда тут уже не фунт изюма.

И если в базе намешаны и те и другие произведения, то как определить какие конкретно использовал ИИ для конкретного сценария?

А не важно, какие конкретно. Важно, что использовал (включил в модель).

Тут такое дело. Любой писатель сценариев в своей жизни читал разные книги. Это тоже вроде как бы "модель". Означает это теперь что все сценарии это плагиат?

это сначала надо доказать

Как я понял из текста, "гильдия сценаристов" не собирается инициировать судебное преследование. Вероятно, она компании-нарушителей занесёт в свой чёрный список, и никто из гильдии не сможет с ними работать. Тем лучше для продвинутых компаний, который будут вынуждены полагаться только на ИИ либо на малоизвестных авторов, не вступивших в гильдию.

Ничего приятного...

Очевидно же, что копирасты и примкнувшие к ним нейролуддиты достаточно быстро (порядка 10-15 лет) зарегулируют использование нейронок - так же, как зарегулировали использование Интернета.

И в итоге напринимают кучу законов, запрещающих обучение и распространение нейронок, не прошедших специальную сертификацию (на патентную чистоту датасета, на "правильное" следование линии партии, на невозможность сгенерировать ЦП, и т.д.).

И, конечно же, будет масса ограничений на использование нейросетевого контента в коммерческой продукции (скажем, не более 20% сгенерированного).

Это бессмысленно запрещать, потому что во-первых, оборудование будет стоять у каждого на столе, во-вторых, невозможно доказать, нейронка сделала контент, или человек.

Когда Интернет только появился, народ тоже ржал над попытками что-то тут запретить. Вот только потом стало не до смеха.

Достаточно провести пару образцово-показательных процессов и дать лет по 500 тюрьмы парочке случайно отловленных лиц, использующих несертифицированные нейронки, и желающих резко поубавится. А там уже и более целенаправленно работать станет возможно.

Одновременно ограничить продажу чипов, на которых всё это можно тренировать (это использовать можно даже на смартфонах, а вот с нуля натренировать сеть уровня GPT-4 на потребительском оборудовании невозможно).

невозможно доказать, нейронка сделала контент, или человек.

И когда это останавливало копирастов? Они поступят так, как всегда поступают в таких случаях: возложат бремя доказательства на самого обвиняемого. Не смог доказать, что твой контент создан без использования нейронки? Значит виновен.

Победят, как обычно, деньги.
И не факт, что у копирастов их будет больше. Другая сторона — производители железок, вряд ли они так легко примут запрет продаж видеокарт игрокам. Да и против копирастов будут другие дельцы, боссы студий, выпускающих контент, которые с радостью заменят нейронками художников, сценаристов, актёров, программистов.

Одновременно ограничить продажу чипов, на которых всё это можно тренировать

хмм.... могут сделать aka ватермарки но, в текст (стиль,пунктуация, форматирование и прочее в комплексе)

Например, ChatGPT сделает ватермарки, а Brad от Google не сделает. Угадайте, куда пойдут пользователи?


Если законодательно обяжут всех, пойдут к китайцам, которые не подчиняются чужим законам. В крайнем случае, начнут разработку модели у себя для внутреннего использования, особо не афишируя. Или возьмут опен-сорсное и вырежут ватермарки.

Я не только про нейросети. Посмотрите на короткие видео (тикток, шортсы, рилсы), там как факт отсутствует авторское право)

Пожалуй разделю ваше злорадство.

Современная концепция авторского права это какой-то феерический бред тормозящий прогресс и творчество. Давно пора было эту помойку разворошить.

Независимо от антуража (прошлое, настоящее, будущее), сюжеты базируются на свойственной человекам мифологическому мышлению. Т.е., осознанно или нет, являются плагиатом. Противостояние такому же плагиату от ИИ - это проявление луддизма и обречено на провал.

https://ru.wikipedia.org/wiki/Тысячеликий_герой

UFO just landed and posted this here

Сможет ли развитие нейронок привести к деградации контента? Когда труд писателя не будет востребован и они исчезнут как класс. Новые нейронки будут обучаться на контенте созданном другими нейронками и это не будет в итоге совсем-совсем одна история, только с разными именами. С одной стороны этим грешат и люди, но с другой человек с большей вероятностью может создать что-то совсем новое на основе личных переживаний.

Во первых некоторые люди пишут книги просто потому что им хочется их писать. Или даже потому что они не могут их не писать. И такие люди никуда не денутся.


Кроме того ИИ будет генерировать "мейнстрим". Это будет относительно дёшево и быстро. Но так же будет спрос и на "настоящие вещи". И за них и дальше будут хорошо платить.

Я наверно сейчас немного разрушу ваш внутренний мир, но человеческий мозг - это тоже нейронка. И она точно также обучается с каждым годом на контенте, в том числе который под авторскими правами. Просто человек технически это делает очень медленно и пока выигрывает чисто количеством нейронов - сделайте нейронку на 100млрд нейронов и люди соснут сразу же

Sign up to leave a comment.

Other news