Comments 138
То есть все авторы книг против того чтобы читатели читали их книги? Потому что если они их прочитают и, не дай бог, чему-нибудь научатся, то это будет огромной потерей для авторов. А если они вдохновятся книгой и попробуют написать что-то своё - это причинение убытка автору. А если они прочитают научную статью и процитируют в своей работе, а это будет вообще кошмар.
То есть все авторы книг против
Все правообладатели* против...
Человек купивший книгу и ИИ который с очень высокой точностью может сгенерировать такую же книгу за несколько секунд или минут. Это же очень разные вещи.
Но они же не могут. Того же клода британские учоные долго и изощренно пытали что бы выудить из него гарри поттера почти целиком.
Доказали только то что он читал эту книгу, и гипотетически может ее выдать, если его долго бить по лецу.
А может даже и не читал, добывали же мелкими кусочками, может он эти куски видел в цитатах на разных сайтах.
Не уверен. Попытка создателя товара ограничить область его применимости, а особенно - ограничить возможность использования товара для создании конкурирующего, - очень плохой паттерн.
Как уже говорили тут, это как запрещать использовать дрели для строительства завода по производству конкурирующих дрелей. Звучит абсурдно.
И, что самое плохое, когда правообладателям начинаешь давать в руки такие инструменты - регуляцию применения товаров - получается дивный новый мир, где прав у покупателей около нуля.
Не уверен. Попытка создателя товара ограничить область его применимости, а особенно - ограничить возможность использования товара для создании конкурирующего, - очень плохой паттерн.
Это неверная аналогия.
Правильная такая: если я запишу лицензионный CD альбом леди гаги на мастер-пластинку (понятно, что 1 в 1 не получится из-за ограничений аналогово-механической записи звука) и стану далее штамповать винил и продавать эти пластинки - это же нарушение авторских прав.
Именно это и делают разработчики ЛЛМ покупают книги (а многие тупо качают пиратки с инета), обучают на этом модели (контент частично копируется в веса, но не 1 в 1 как и при аналоговой копии) и потом продают это как НОВЫЙ продукт.
Вопрос вообще говоря неочевидный.
Можно ещё так рассуждать: при копировании через промежуточный аналоговый носитель у вас в каждый момент времени существует копия исходника как целостная сущность. Будь то рип с CD или матрица для штамповки винила.
В LLM такой копии нет. Да, после загона туда пусть того же альбома вес слова Alejandro увеличится с условных 2,718 до 3,14, но однозначно определить по весам, где в них прячется альбом - невозможно.
А, вот, за второй вес сейчас обидно стало! Чего это 14, а не 142? Если было 2,718, а используемые для хранения и извлечения из памяти чисел методы не изменились, значит точность не должна была ухудшиться. Потому, вес слова Alejandro должен был стать 3,142. Не так ли?
Ну т.е. компрессия с потерями тоже может трактоваться как ненауршение ничьих прав :)
Тут сложная юридицеская цепочка, на самом деле, один из вызовов современного мира:
Модель точно использовала текст для обучения,
И юридически она - не индивид, и точно не физическое лицо. Компания планирует использовать результат обработки этих данных, чтобы зарабатывать много денег
В весах не то, чтобы книга - но опыты показывают, что большие куски произведений можно оттуда вытащить! Самосбывающееся пророчество про число Пи как лучшую компрессию!
Их коммерческий (!) продукт может реплицировать чужие произведения на основе своего обучения. Похожая ситуация на то, что могу делать я, прочитав книгу. И если я цитирую иногда то, что мне не принадлежит - я считаю, что яв рамках легального поля (поэтому я ненавижу Ютуб, который по DMCA запрещает иногда даже фрагменты аудио/видео). Но тут - модель может чуть <irony>постабильнее и в немного больших масштабах</irony> (и работая только на благо инвесторов АИ-бума)
В LLM такой копии нет
в том то и дело, что есть, видоизмененная копия, но это КОПИЯ, это не меняет суть дела, при определенной сноровке в обходе защиты, можно достать её практически дословно
Нарушение авторских прав и нарушение интеллектуальной собственности - два разных нарушения. Если диск выпускается с сохранением имени автора и исполнителя - авторские права не нарушены.
Окей, у меня ОЧЕНЬ важный вопрос! Сколько человек вы знаете, которые попросили LLM воспроизвести им "Гарри Поттера" и ПРОЧИТАЛИ это? Ну хоть известный рассказ какой-нибудь? Ну хоть стишок Чуковского?
Если говорить о стихах и музыке, то миллионы. Потому что они уже в топе Яндекс Музыки.
И не просто в топе, ИИ трек Сыпь гармоника - это первое место.
Расхожий сценарий другой. Загружаешь в нейронку содержание книги и задаешь по этой книге, не выходя за ее границы, вопросы. Я уже несколько раз так делал.
Так их прочитали или отсканировали?
Одно дело, когда с купленной книгой познакомится несколько читателей и совсем другое - неограниченное количество клонов читателя, созданных специально для распространения знаний, в том числе и об этих книгах, в том числе и близкого к дословному пересказа.
а где грань?
1 человек - ОК.
10 человек (большая семья) - ОК
50 человек (друзья, семья) - ОК
2000 человек (библиотека) - ОК
А начиная с какого уровня не ОК? И почему?
С 50. Вообще, конечно лицензия должна быть на каждого читателя, т.е. 10 тоже в целом "не ОК".
Причина проста: именно так можно было бы получить корреляцию между количеством читателей и денег полученных автором.
Библиотека - это другое. Общество требует снабжать книгами библиотеки, таковы условия.
С 50. Вообще, конечно лицензия должна быть на каждого читателя, т.е. 10 тоже в целом "не ОК".
Нет, лицензионные ограничения использования продукта должны быть признанны незаконными, как нарушающие право частной собственности.
Причина проста: именно так можно было бы получить корреляцию между количеством читателей и денег полученных автором.
А зачем законодательно упрощать и смещать эту корреляцию?
Ну просто я за то, чтобы те кто делают работу хорошо размножались, а те кто требуют прав и нихрена не делают - нет. Вот за этим.
Лицензионные ограничения продукта, защищают частную собственность. Интеллектуальную частную собственность. Если вы против них, я вас поздравляю, вы против частной собственности - да, против частной собственности на продукты интеллектуальной деятельности, но все же - против.
Нарушаю ли закон если оставлю книгу в больнице, где её могут прочитать 50+ чел ?
Вообще грани с литературой тонкие: я могу передать гаджет электронную книгу почитать знакомому, но не могу передать файл с неё ему же :)
P.S. Чем больше читателей познакомится с книгой - тем больше шансов, что у авторов купят их произведения.
Текущий закон, или тот закон, который я хотел бы?
Текущий безусловно нет, имеете право потерять. Впрочем если у вас был умысел распространения и это удастся доказать, то тут не знаю, возможно и нарушаете.
Совершенно точно если вы дома откроете кинотеатр и будете купленные видеофильмы показывать - нарушите. Если будете там же эту книгу вслух читать, вероятно тоже.
но не могу передать файл с неё ему же :)
В некоторых случаях можете. В смысле это прямо поддерживается системой. Пример из старого - стартап Embiid - прямо говорят что файл можно пока это "другу и семье", но при условии что вы и вашу личную копию читалки (.exe) дадите (она не защищена но прямо отображает чья)
Пример из нового - у Kindle вроде функция lend была но с какими то там ньюансами, у Bookfusion - функционал вроде тоже есть если вы через них покупали (судя даже по их Discord'у - многие Bookfusion'овским магазином - не пользуются)
Раньше деньги зарабатывались с продажи копий, т.е. тиража. Кто и сколько раз их прочитал было не важно, т.к. если книги распроданы, то затраты на их выпуск отбит и автор тоже вознагражден.
Плата за индивмдуальные просмотры это уже веяние цифровых технологий, где правоторговцы увидели для себя новые возможности извлекать прибыли из того же самого материала, не добавляя от себя ничего сверху.
С 50. Вообще, конечно лицензия должна быть на каждого читателя, т.е. 10 тоже в целом "не ОК".
То есть перепродать книгу после прочтения уже или нельзя, или все вырученные деньги должны пойти собственнику интеллектуальный прав на неё?
На сегодня на мой взгляд было бы правильно не перепродавать.
Выж не жалуетесь что по вашему билету в кино не пускают вашего племянника. И тут была бы уместна подобная схема.
Это позволило бы меньше за билет платить при прочих равных и иметь прозрачную метрику для оплаты авторских.
А вот тут было бы круто доказать, что "это позволило бы меньше платить"
При цифровой дистрибъюции, как мне известно, цена определяется только лишь наличием конкурентов и глубиной кошельков пользователей.
Выж не жалуетесь что по вашему билету в кино не пускают вашего племянника.
Что есть дурдом, где такое введено. Потому что кинотеатру и всем прочим должно быть совершенно все равно, кто по билету смотреть пришел и пришел ли вообще.
Даже если отвязаться от продажи физического объекта - тут право посмотреть (один раз) куплено? Куплено. После этого того, тем кто это право предоставляет, нужно по рукам бить, если им вдруг не все равно, кто этим правом пользуется.
А с перекупщиками бороться надо (именно для этого именные билеты придумали) надо ценой, соответствующей спросу.
Я вообще удивляюсь, честно говоря, как библиотеки до сих пор существуют.
Я тоже. Как и вообще право частной собственности.
Но ничего, уже скоро всё это будет описано в истории.
А сколько библиотек считают, что знания должны быть полностью свободны? Это живые организации с финансированием. После полного освобождения (растворения в децентрализованном цифровом архиве) их можно было бы без большого ущерба закрыть, так что это не в их интересах.
Классическая библиотека не сильно мешает, из-за неё нет смысла юридический статус-кво шатать. Нужный экземпляр есть в Сиднее? Даже большинство австралийцев такой доступности не обрадуется. А сиднейцы, допустим, обрадуются, но на следующем этапе квеста обнаружат, что библиотека не публичная.
Опросов среди руководства библиотек не проводилось, что они сочтут меньшим риском - уничтожение коллекции (пожар) или утечку копий. Может, средняя библиотека существует в таких условиях, что предпочтёт пожар. В исторических библиотеках тоже имелось хорошее представление о контроле доступа:
В 213 году до н. э. император Цинь Шихуан приказал уничтожить большую часть неугодных ему книг
Ptolemy VIII expelled all foreign scholars from Alexandria
Авторы против плагиата. Если вы возьмете условного Гарри Поттера и тупо через ctrl-f замените все "Гарри" на "Петька", "Хогвартс" на "Лукоморье" и т.д., и выпустите своую книгу про похождения мальчика-волшебника, вас засудят за нарушение авторских прав.
С другой стороны, если вы вдохновитесь книгой и напишите что-то свое, вроде "Гарри Поттер и Критическое Мышление", вас возможно даже похвалят.
И там и там вы взяли другое произведение и что-то на его основе сделали, что-то скопировали, что-то изменили, где-то сами додумали. Вторая версия прощается только потому что человек своей головой, во время "вдохновления", работает очень медленно и воспроизводит исходный текст очень неточно. Нейросетки же работают быстро, дешево и точно воспроизводят чужие работы. Есть много аргументов считать, что это ближе к ctrl-f и автозамене, чем к "вдохновлению".
Нет, вы нимного не правы. Вы можете сколько угодно заменять имена. Вот когда захотите это продавать и получать с этого прибыль - начнутся вопросы.
Если бы ребята из стартапа собрали деньги на кикстартере, а результат вывалили в открытую, вопросов к ним было бы только у барыг-издателей. А ак - я тоже считаю, что они "вкрысу" отсканили кучу данных и теперь ими торгуют из-под полы.
Это не чтение, а обучение искусственного интеллекта, чтобы потом за деньги оказывать услуги потребителям. ИИ будет сам писать книги по запросам "авторов". Сейчас уже почти все сайты завалены постами, созданными ИИ, а теперь ещё и книги такие станут.
А ты способен увидеть разницу между прочтением книги человеком и загрузки данных из книги в ллмку? Если нет, я тебя поздравляю, ты левый и скоро пойдешь бастовать за права роботов.
Люди, уничтожающие книги, достойны отдельного цеха в аду, с котлами на паре повышенных параметров.
Есть аналогия с книгой "451 градус по Фаренгейту" Оруэлла. Потом через ИИ они будут контролировать людей
Кстати, да. А Брэдбери с Оруэллом Вы круто скрестили.
Они их всегда контролировали) Сейчас инструмент меняется.
"451 градус по Фаренгейту" Оруэлла.
1984 градуса же!
а как вы думаете, что делают в библиотеках со старыми и непопулярными книгами ;)
В Москве бесплатно раздают желающим, не больше 10 в одни руки за раз. Благодаря этому проекту пополнил свою библиотеку интересными экземплярами.
Американские продают на вторичном рынке. Специальный штамп об этом ставят. Еше до 22 года я кучу таких покупал.
В течение какого времени? Такие продажи обычно ограничены по времени. Если такую книгу за год или три года никто не купил, то что с ней происходит?
Так понимаю, в букинистике книг старше 3 лет не существует?
Откуда я могу знать ? Но покупал десятилетней давности издания уж точно, может и двадцатилетней.
Впрочем если это никому не нужная книга, зачем плакать о ее судьбе ?
Полагаю они цены со временем опускают. Это было бы логично.
Откуда я могу знать ?
Ну я к тому, что возможно эти книги потом уничтожают, а эта ветка началась с призыва выделить таким людям отдельный котел в аду.
Впрочем если это никому не нужная книга, зачем плакать о ее судьбе ?
Я и не плачу, я и сам так же считаю. Но ниже люди сокрушаются, что вдруг она через двести лет окажется нужной.
У нас городская библиотека ненужные запасы по 1 евро за книгу отдает. Акция длится несколько дней, а потом не знаю куда эти книги увозят.
Понимаете ли в чем дело
1. Книги как раз таки нужные, иначе чего их содержание воруют то.
2. Делают это только для того что бы замести следы. Нет тела нет дела.
3. Все это выглядит ещё и как неуважение - авторов не спросили, их труд используем, а книжку потом уничтожим.
Так-то - книг много мир не умрет (только если эти гении не додумались уникальные документы уничтожить, а от них всего модно ожидать), но именно сам контекст настолько мерзкий, что я не против котла.
1. Книги как раз таки нужные, иначе чего их содержание воруют то.
Как вы отличаете нужную книгу от ненужной? Книги как раз все подряд.
2. Делают это только для того что бы замести следы. Нет тела нет дела.
У вас есть идеи, как можно полезно применить разрезанные книги?
3. Все это выглядит ещё и как неуважение - авторов не спросили, их труд используем, а книжку потом уничтожим.
Книжки куплены (кроме тех, которые скачаны), так что труд авторов оплачен. Как владелец купленной книги я могу ее поставить в книжный шкаф, чтоб иногда читать, а могу и под шкаф, чтобы он не шатался. Могу и мусор, это не запрещено.
Может ещё хлеб нельзя выкидывать - боженька накажет?
Что за средневековые суеверия?!
Насчёт хлеба у меня лично "суеверие", навеянное местом рождения (город-герой Ленинград). А что до остального - были когда-то пацаны в коричневых рубашках, которые от этих средневековых суеверий начисто отреклись (при этом погрузились в другие, но это другая история).
Куда попало? Ну да, нельзя. Еда гниёт, плюс привлекает насекомых, плюс паразитов.
Если это испорченный хлеб - то аккуратно его выбросить можно. Если это свежий хлеб - встаёт ещё вопрос на кой черт его выкидывать. Если хлеб свежий и вы его не доели - встаёт вопрос почему вы не научились за жизнь определять сколько вам нужно хлеба для еды и почему вы по сути просто так тратите чужие или свои ресурсы.
Выброшенный хлеб - это ваши выброшенные деньги. Людям не нравится когда кто-то как безумный просто так сжигает свои деньги - это подозрительно.
Если дурачок делает что-то, исходя из того что его бог накажет, это ещё не значит, что ваш подростковый бунт против его "глупости", сделал вас умнее.
Скорее сохраняющие. Бумажная книга хранится каких-то 100 лет.
Это неплохо на фоне цифровых носителей. Да, цифру гораздо дешевле перенести на другой носитель, но тут встаёт ещё вопрос долговечности форматов.
TXT кажется практически вечным. Да, с кодировками есть нюанс, но это не то, что может сделать файл нечитаемым.
математики такие: "ну да, пошли мы к чёрту".
Увы, форма хранения литературы - это не txt, и даже не pdf. Тут надо хранить и оригинальный скан, как битмэп, и текст с сохранением абзацев, отступов, переносов, центрирования.
Ну достаточно где то в начале файла книги привести таблицу соответствия битмапа определенной буквы, если уж так нужно сохранить оригинальный вид, а там кому если сильно надо будет - хоть вручную эти файлы декодировать смогут. Что же до абзацев, отступов и переносов - в самом первом html это давно решили - в отличие от постоянно меняющихся форматов того же ворда или либре офиса.
Так-то PDF позволяет несколько слоёв держать: и битмап, и текстовую подложку. Более того, есть такой PDF-A, более строго стандартизованый, специально для архивов, в т.ч. и со сложной типографикой.
Но опять же, один формат, да ещё и проприетарный...
Формат - проблема не только уровня структуры файла, а ещё и файловой системы как таковой, носителя, его интерфейсов... Для книг, т.е. тиражных произведений, проблема не настолько острая (хоть одна копия на актуальных носителях и форматах в каждый момент времени будет, и её можно будет перегнать на следующее поколение). Но вот исходники старого софта бывает, восстанавливают со всяких дискет необычного форматирования.
...Задумчиво смотрю на свою полку с книгами по электричеству, вышедшими до 1917г...
100-летнюю буамажную книжку я сам на помойке находил. У меня в семье хранились и 150-летние, у друзей - 300. В руках держал (не в музеях) 600. Боюсь, ни один стандарт ФС столько не протянет.
Может, и сохраняющие, но для кого?
Попользуются и либо удалят, либо потеряют вместе с очередным сгоревшим датацентром.
Эээ 100? Под 200 несколько штук стоят в шкафу, совершенно целые. В музеях и не такое видел, но эти хранили 200 как попало совершенно, лет 50 вообще на даче пролежали.
Лол, сколько пафоса. Они были оцифрованы. А ведь иначе они бы сгнили и были бы утилизированы
техногиганты лихорадочно и порой втайне участвуют в гонке, чтобы получить интеллектуальное наследие человечества.
Ой, сколько пафоса..
А вообще на кой сканировать миллионы книг, ведь в худ. литературе плюс-минус все одно и то же.
Массив данных для обучения
И что, там по-разному слова во фразы складываются? Ну не одна книга, пусть 10 или 100 или 1000. Если взять тысячу книг и сравнить с другой тысячей книг - будет какая-то разница в среднем?
Да и в комментариях тут, на Хабре, плюс-минус одно и то же, однако это нам не мешает их генерить ежедневно тыщами)
-- Что будем дарить ему на день рождения?
-- Может книгу?
-- Не, книга у него уже есть.
Если бы они отдали отсканированное в libgen, то была бы совсем другая история. А так - паразиты.
Даже так - уже размытие границ правообладания. Уже хорошо. Теперь есть как минимум ещё один бэкап. Может когда-нибудь эта база "утечёт"...
А вот это им точно юристы запретили бы(
Потому что использование внутри, только для обучения, может прокатить под "трансформационную обработку", но вывод за контуры этой системы как есть - уже копирование.
Китайские и российские ИИ-компании стоят в сторонке, посмеиваясь. С их никто не требует по 1.5 млрд долл за скачивание тех же сетевых библиотек.
Смотрю на ютабе всякое про металлообработку. Иногда там ссылаются на советскую технарскую литературу - и я каждый раз удивляюсь, насколько грамотно там все расписано. В принципе, в США должна быть такая же история с литературой индустриальной эпохи.
И теперь выходит, что это книги могли быть уничтожены, чтобы горстка хипстеров из Калифорнии могла обогатиться? Да, всё верно выше сказали, про отдельный котёл в аду.
Впрочем, кушаем слоп дальше, не отвлекаемся.
И теперь выходит, что это книги могли быть уничтожены,
Отнють.Уничтожается один экземпляр книги, при этом переводится в цифровую форму и (надеюсь) остается в архивах компании на неограниченное время. Это.. как бы несколько отличается от сквозившего у Вас "все книги по архитектуре/машиностроению (нужное подставить) эти злодеи уничтожают"...
Уничтожается один экземпляр книги, при этом переводится в цифровую форму
Не вижу в публичных материалах деталей про именно 1 экземпляр. Почему вы так думаете? Плюс некоторые книги за давностью лет могли быть именно в единственном экземпляре.
(надеюсь)
Надейтесь. Кто ж запретит? Но скорее всего какая-то часть информации теперь навеки в эмбедингах моделей, перемешанная черт знает с чем и выдаваемая с глюками.
сконвертировать от 500 тыс. до 2 миллионов книг
Если это полные сохранившиеся тиражи - то, выходит, они затеяли все эти закупки только ради нескольких тысяч наименований. Для обучения - ни о чём. Да и непонятно, зачем все экземпляры через конвертирование прогонять.
Если же это количество наименований, то количество экземпляров в полных тиражах, опять же, будет порядка на 3 больше. И это точно не делается по схемам, описанным в статье - попытки договориться с единственным, пусть и большим магазином, найти закрывающуюся библиотеку и т.п. Тут придётся прошерстить все библиотеки, вплоть до Конгресса.
Вот во что охотно верю - что они не заморачивались, последний это экземпляр или нет.
Не вижу в публичных материалах деталей про именно 1 экземпляр. Почему вы так думаете?
Конечно же они скупали все тиражи целиком. Чтобы взять оттуда один экземпляр, скормить его иишке, а все остальные тысячи уничтожить. Чтобы человечество никогда не узнало, чтобы написано в той книге!
Плюс некоторые книги за давностью лет могли быть именно в единственном экземпляре.
Если ценная книга осталась в единственном экземпляре, то она лежит в музее. Если ее можно вот так просто купить, тот эта книга никому не нужна.
Если ее можно вот так просто купить, тот эта книга никому не нужна.
Это она на данный момент никому не нужна.
Возможно, лет через двести будет очень досадно, что её больше нет.
Надеетесь на разумность и ответственность корпорации ? Не хочу вас случайно оскорбить попав в цель, так что сперва спрошу - У вас диагноз?
А немецкая техническая литература! Химические статьи, пром. учебники 30х-70-х годов! Их очень сложно переводить из-за манеры писать сложные предложения, и при переводе часть выразительности (не литературной, а справочной) теряется, но, как же классно там расписывали инструкции, методики!
Вернор Виндж, "Конец радуг". Там был именно такой кейс описан - разрушающее сканирование ради монополизации доступа к информации из книг.
Интересно, что это компания, глава которой много говорит о рисках ИИ, этике и безопасности для человечества - вот на Хабре мой перевод его программного эссе "Подростковый период технологий"
Как-то даже не смешно, что Интернет задумывался для того, что бы у всех был доступ к информации, а здесь цель завладеть большим количеством информации, но по платной подписке. И это при всём том, что, в контексте нейронок, информация может быть несколько привранной, и это печалит ещё больше
Нынешняя криптография основана на том, что усилия, требующиеся для расшифровки настолько велики, что превышают полезность добытой инфы. Как только (и если) появится инструмент, который снизит усилия до целесообразного уровня, нынешняя криптография прекратится.
Экономика книг и сопутствующие законы об авторском праве базировались на ограничениях в скорости работы с информацией, которые человек не может преодолеть. Если бы каждый читал миллионы книг, вся схема была бы какой-то другой. И вот появилось нечто, что ограничений не имеет, а ничего кроме старых принципов регулирования нет. И какбэ старые принципы не нарушаются, и какбэ вроде несправедливо получается.
Хотя наверное все банальнее. Кто-то делает МНОГО бабла на инфе из книг. Владельцам (формальным, через правообладание) это не нравится, и они считают справедливым получить свою часть. Делали бы немного - никто бы не возникал.
Почему именно уничтожить, а не отвезти куда‑то в небогатый регион и раздать? Минус лишний негатив в адрес этих компаний, что им сейчас, конечно, важно.
Потому что разрезанные книги мало кому нужны, например.
Есть аппараты для сканирования без необходимости повреждать книгу.
Хотя, может, они слишком медленные для их целей. Но вариант же есть.
Желаю успехов в сканировании тысяч книг на таком аппарате.
Есть у меня большая стопка журналов из детства, из 60-80-х годов (сам в букинистическом покупал). Решил перечитать, но бумага уже ветхая, нужно очень осторожно обращаться. Стал интересоваться услугами сканирования - да, есть фирмы, посылаешь им литературу, получаешь обратно файлы. За дополнительную цену могут выслать обратно разрезанные листы. Массовое дешёвое сканирование, увы, деструктивно.
Понятно, что у учёных и кому ещё надо есть специальные сканеры и можно приставить человека, который будет внимательно контролировать процесс, но миллионы книг так не оцифруешь. Если большинство книг не было раритетами, то почему бы и не порезать.
Например, потому, что для сканирования, с книг срезают переплёт, приводя их в негодность с т.зр. возможности использования человеком. А также потому, что лишняя огласка изначально была нежелательной.
Видимо потому что авторские права. Вообще - был (может и есть) такой стартап 1DollarScan - они примерно тоже самое делали но книга заказчика (можно с Amazon'а прислать сразу им) и потом заказчику - файл. Говорили что так надо чтобы не нарушать авторские права.
Суть проста. Когда мы читаем книгу или отдаем ее другу - мы на ней не зарабатываем, разве что становимся духовно богаче.))) А тут некие люди купили книги, поколдовали с нейросетью и теперь продают эти книги (ухудшенные в процессе обработки) как свои. Другие люди платят за то, что берут эти чужие тексты и идеи, делают из них другие тексты и опять продают их как свои. Поэтому явно авторское право нарушено. У меня только один вопрос - зачем? Зачем плодить все эти тонны слов, все это механизированное словоблудие?
Ради повышенных прибылей производителей памяти и NPU ?
Хорошо, некая профессиональная обучающая книга. Неважно, по программированию, деревообработке, учебник математики в конце концов. И прочитавший эту книгу зарабатывает на своем новом знании. Должен ли он отдавать какой-то процент от заработанного автору/правообладателю/издательству/черту лысому? А какой процент?
Должен ли он отдавать какой-то процент от заработанного автору/правообладателю/издательству/черту лысому?
Вообще говоря - именно в такой формулировке можно притянуть за уши, что будет полезно. Потому что создает инициативу писать так, чтобы обучившийся зарабатывал побольше.
А какой процент?
Какой-то процент от заработанного(смотреть сколько там принятый процент амортизации средств производства используется) разделить на все количество использованных материалов - каждому автору учебника по пропорциональному кусочку.
Человек научился читать по букварю. Как известно, ни на какую работу без умения читать не устроится. И это очень важное умение. Какую часть зарплаты он должен отдавать? Процентов 50? Потому что без умения читать он бы там не работал. А там еще в очереди учебник русского языка за 5 класс, 6 класс, учебник математики, собственно, профессиональные учебники... Кто будет выяснять каждый раз? Специальные юристы?
До абсурда можно довести любую ситуацию.
Процентов 50? Потому что без умения читать он бы там не работал.
Учитывать процент влияния - все переругаются, какой именно процент.
А вот учесть всю наименования литературы, что он использовал за время школы и прочей учебы - выглядит хотя бы теоретически выполнимым. Причем тут даже скрывать, что ты что-то использовал при учебе, не имеет смысла - процент-то один и тот же, только по разному распределяется.
До абсурда можно довести любую ситуацию.
Разумеется, потому я и сказал, что 'притянуть за уши'.
Но некая логика в таком подходе есть, хотя она и выглядит порядком извращенно. Там еще комплектом можно добавить процент тому учебному заведению, в котором учился. С тем же обоснованием такого подхода: 'лучше учишь - тебе потом больше отчислений выпускники принесут'.
Если бы все было так просто… Действительно мы растем и учимся и достигаем чего-то за счет книг, знаний. Но они проходят внутри нас свой путь. В случае с нейросетью такого пути нет. Например. Я купила и прочитала пособие по вязанию, начала вязать и продавать вещи. Я - молодец. Второй вариант. Я купила пособие по вязанию, никогда не вязала, переписала пособие с ошибками и продала как свой опыт. Наверное есть разница.
Если бы все было так просто… Действительно мы растем и учимся и достигаем чего-то за счет книг, знаний. Но они проходят внутри нас свой путь. В случае с нейросетью такого пути нет. Например. Я купила и прочитала пособие по вязанию, начала вязать и продавать вещи. Я - молодец. Второй вариант. Я купила пособие по вязанию, никогда не вязала, переписала пособие с ошибками и продала как свой опыт. Наверное есть разница.
учебник математики в конце концов
Должен ли он отдавать какой-то процент от заработанного автору/правообладателю/издательству/черту лысому?
Полагаю потомкам Пифагора и Декарта :)
Так в традиционной схеме он уже отдавал, когда книгу покупал. Притом отдавал немало: профессиональная литература всегда стоила дороже беллетристики. Это не процент от заработанного в чистом виде, но наценка за применимость книги для увеличения дохода.
Заголовок «ИИ-стартап блаблабла»
Компания, стоимостью под 200 ярдов USD: «Вот сейчас обидно было»
Если бы были поумнее и не так торопились, то наняли бы подрядчика, который должен был предоставить им материалы для обучения, сам озаботившись соблюдением интеллектуальных прав. Небольшая китайская фирма, знаете ли, которая потом быстро ликвидировалась бы.
Как ИИ-стартап задумал отсканировать и утилизировать миллионы книг