Pull to refresh

Comments 59

в иске отсутствуют доказательства причинения ущерба

То есть если я начну продавать оупенсорс код, нарушая лицензию, я могу сказать, что автор всё равно на нём не зарабатывал, а потому ущерба нет?

Интересную позицию их юристы выбрали, однако. Пойду продавать MS .Net Core, он же в оупенсорс выложен.

Допустимость продажи и открытость исходного кода ортогональны; существуют лицензии, не запрещающие коммерческое использование, в т.ч. распространение. Разумеется, при условии что остальные пункты лицензии соблюдены. В мире существуют все возможные комбинации этих параметров.

Если вы начнёте продавать конкретный опенсорс код, то автор/владелец прав на этот код может подать на вас в суд. И там уже суд будет решать был какой-то ущерб или нет.

Но вы не можете подать в суд на основании что кто-то где-то наверное продаёт какой-то код. И возможно из-за за этого у неизвестно кого возникает ущерб.

Это если совсем грубо.

На самом-то деле это не где-то кто-то продает какой-то код, а Microsoft использует (продает или раздает) программный код, который у себя хостит, и не только бесплатно хостит, есть и платные тарифы. Это все равно что хостеры начнут торговать данными пользователей или на основе данных пользователей хостинга начнут строить свой бизнес. Чего быть не должно по определению.

По поводу суммы 9 миллиардов не мне судить, но за такие дела бить по рукам надо.

Проблема в том что неизвестно чей конкретно код продали или раздали.

И бы сказал что законодательство в нынешнем его виде вполне даёт суду возможность встать на сторону Microsoft.

Проблема в том что неизвестно чей конкретно код продали или раздали.

И бы сказал что законодательство в нынешнем его виде вполне даёт суду возможность встать на сторону Microsoft.

Американское - может быть, не в курсе. В российском - можно заявить требование "о пресечении действий, нарушающих право или создающих угрозу его нарушения" - и тут можно даже не требовать компенсацию, чтобы поставить копилот в одну интересную позу. Потому что "устранять угрозу нарушения" ответчику придётся за свой счёт.

Чтобы ссылаться на это требование для начала должна существовать реальная угроза, а ещё факты, "возможно мой код используют" - не является таковым фактом.

" о пресечении действий, создающих угрозу его нарушения" - то есть самого факта нарушения лицензии не требуется, достаточно возможности её нарушения. Причём устранять эту возможность или доказывать её "на самом деле отсутствие" придётся ответчику.

Для угрозы нарушения вполне достаточно "В настоящее время GitHub Copilot при генерации кода использует миллиарды строк кода из общедоступных репозиториев GitHub": использование есть? - есть, уведомления в результате работы копилота о лицензионных требования нет? - нет, ну вот устраняйте угрозу нарушения как хотите поэтому, хоть не используйте код с непозволяющей этого лицензией, хоть добавляйте уведомление, ну или доказывайте, что в результатах работы копилота нет кода под соответствующей лицензией (интересно будет посмотреть как это доказывать будут, с учётом того, что использование-то чужого кода признаётся фактически).

Компенсации ущерба и т.п. при этом не будет, разумеется.

за что бить?
9 миллиардов это просто потому что беспрецендентное дело, как считать штраф непонятно.

Проблема на лицо — ты написал код, выложил его на площадку, под лицензией, заставляющей что либо делать тех кто его смотрит (буквально, ну к примеру по прыгать на одной ноге), а площадка запилила робота (скрипт), который перемешивает твой код с кодом остальных и показывает результат другим пользователям и в результате твой код смотрят но 'не прыгают на одной ножке', ты как разработчик кода 'терпишь невыносимые страдания' что твою лицензию нарушают а закон никак не помогает.

Подумай хорошенько, что лежит в сути идеологии opensource и в частности GPL-подобных лицензиях.

А решать тоже не ясно как, заставлять прыгать на одной ноге робота бессмысленно.

Само собой, все эти проблемы — результат проблем капитализма как ядро социального устройства мира (решений нет, никакие другие формации не предлагают красивых решений)

А решать тоже не ясно как,.

Решать-то просто - не использовать роботом код, если не уверены, что лицензия это позволяет. Или проверять лицензию и выводить потребителю предупреждение, что мы вам тут код наплодили, подпадающий вот под этот список лицензий на 10 экранах, так что либо удовлетворяй им всем, либо не пользуй то, что мы тебе наплодили.

Но это не тот бизнес, который хотел замутить Microsoft.

Имел в виду Microsoft за такие дела бить по рукам, а не истца.

Там же написано как посчитан штраф = количество использований copilot * типичный штрафа за нарушения авторских прав

Как-то они забыли любимую копирастами "упущенную выгоду". С чего такие провалы в памяти? :D

Там просто счёт на триллионы пойдёт. Ни у кого столько денег нет, так что и заморачиваться смысла нет. Для начала решили 9 ярдов отжать. Но лиха беда начало.

Microsoft .NET Core распространяется под лицензией MIT, можно делать почти что угодно, в том числе продавать:

Permission is hereby granted, free of charge, to any person obtaining a copy of this software ... to ... sell copies of the Software ..., subject to the following conditions:

Только после продажи покупатель снова может делать с полученным что угодно:

The above copyright notice and this permission notice shall be included in all copies or substantial portions of the Software.

Аналогичная история с GPL: если вы получили бинарники или код — можете делать почти что угодно, в том числе продавать. Правда, обязаны передать покупателю исходный код, даже если продаёте только бинарники.

Но есть ещё интересная штука под названием "торговая марка". Не удивлюсь, если последовательности букв "Microsoft", "Microsoft .NET", ".NET", ".NET Core" являются торговыми марками. Тогда с ними совершенно другая история идёт про использование, независимо от лицензии на исходники. Например, наверняка нельзя использовать в рекламе просто так без разрешения Microsoft. Я даже слышал байку, что в США владелец торговой марки обязан докапываться до её использования без разрешения, иначе отберут с комментарием "а зачем она вам тогда нужна, если не отстаиваете". Не знаю, насколько правда.

Но есть ещё интересная штука под названием "торговая марка".

Для пущей корректности - в российском законодательстве об интеллектуальной собственности нет "торговых марок", а trade mark в нём называется "товарный знак" (ну или "знак обслуживания", если речь идёт об услугах).

независимо от лицензии на исходники

Всё верно. Да, на товарный знак тоже нужна лицензия, и он - не объект авторского права, так что лицензия на сорсы на него не распространяется, его надо указывать вне контекста сорсов (хотя можно и в том же документе).

Не удивлюсь, если последовательности букв "Microsoft", "Microsoft .NET", ".NET", ".NET Core" являются

"Microsoft" точно является, можно даже не сомневаться (хотя и проверить можно, но тут всё проще - это способ защиты бренда). На счёт дотнетов не проверял, но не удивлюсь - всё по той же причине "защита бренда": у MS почти все названия продуктов зарегистрированы как товарные знаки.

UFO just landed and posted this here

Это зависит от конкретной версии лицензии gpl, например, GNU GPL v2 запрещает продажу, а менять лицензию можно только если ты переписал не менее 60% кода.

Точно уверены?..

UFO just landed and posted this here

А доказательства предъявить, отличные от "поверьте мне на слово"?..

Вот в https://www.gnu.org/licenses/old-licenses/gpl-2.0.html - даже цифры "60" нигде не встречается, например.

Хотя бремя доказательства лежит на утверждающем, так что я могу даже не тратить время на опровержение вашего заявления.

GNU GPL v2 продажу разрешает, и никаких упоминаний 60% в тексте лицензии нет и близко.

Does the GPL allow me to sell copies of the program for money?

Yes, the GPL allows everyone to do this. The right to sell copies is part of the definition of free software. Except in one special situation, there is no limit on what price you can charge. (The one exception is the required written offer to provide source code that must accompany binary-only release.)

UFO just landed and posted this here

Бинарники можно продавать только в комплекте с исходниками, да.

"Копию" — в смысле что нельзя взять программу под GPL и продать кому-то исключительные права на её использование, чтобы это кто-то мог решать, что можно и нельзя делать? Как только опубликовали под GPL, джин выпущен из бутылки. Да, нельзя, конечно. Как нельзя продать любую программу, если ты не правообладатель.

Но если есть согласие всех исходных авторов, то можно взять ту же версию кода, перелицензировать как душе угодно без переписывания код, и вот эту перелицензированную версию кому-то продать. Тогда старая версия остаётся под GPL (и с ней нельзя ничего запретить), зато новая может быть проприетарной сколько угодно.

Извините, а чем отличается продажа копии от продажи бинарников? И что вообще вы понимаете под "продажей"?


Пункт 4, на который вы ссылаетесь, запрещает всё что не разрешено в других пунктах, и не может запрещать продажу потому что она разрешена пунктом 3.


Пункт 6 запрещает менять лицензию при продаже, но саму продажу не запрещает.

UFO just landed and posted this here

Разница в том, что бинарники и исходники всегда доступны для свободно загрузки, а не собирай сам из исходников, если не хочешь платить, как некоторые думают.

Собственно никто не запрещает отдать сорсы без бинарников, хоть за деньги, хоть не за деньги. Но вот отдать бинарники даже не предложив взять сорсы - нельзя (всё тот же пункт 3). Но получатель не обязан брать сорсы, но если не взял - то не сможет редистрибьютить дальше.

"Вы можете взимать плату за физический акт передачи копии"

Если вы по какой-то причине оказались обязаны предоставить сорсы на носителе - то вот да, тут за передачу копии можете взять денег. А вот как вы попали в эту ситуацию - уже за рамками данного требования, и вы вполне могли получить свою кучу денег за это.

То есть если я начну продавать оупенсорс код, нарушая лицензию, я могу сказать, что автор всё равно на нём не зарабатывал, а потому ущерба нет?

Допустим, продажа GPL кода какого-то проекта нарушает чьи-то права и наносит финансовый ущерб правообладателю.

Наносит ли вам финансовый ущерб взятый "из вашего проекта" кусок кода - функции "quicksort(array)"? а точно она взята из вашего проекта? она может совпадать до степени смешения (читай - скопирована с SO) с кодом другого GPL проекта, в который он мог попасть из MIT проекта.... в общем, кому ущерб нанесли то?

Конечно наносит, они взяли мой код и не упомянули меня в титрах Аватар2, я не прославился и не заработал миллионы.
Тогда нужно точно так же прекратить иски от компаний, когда их закрытый код частично оказывается в другом проекте. Нельзя принижать открытые лицензии только потому что они открытые.

Я ж правильно понимаю что раз


Microsoft считает, что обвинения в нарушении авторских прав «упираются в доктрину добросовестного использования», которая допускает нелицензионное использование произведений, защищенных авторским правом,

То например утекшие исходники WinXP старый вполне себе можно переиспользовать всем желающим?
Ну и выложенный MS куданибудь код переиспользовать под BSD или GPL (смотря что интереснее), независимо от исходной лицензии?

У fair use есть критерии. Докажешь что под них утечка попадает - используй.

И задача фактически сводится к "у кого лучше адвокаты"? :)


И с другой стороны — (некоторым) разработчикам не нравится что творит MS с CoPilot'ом. Но Stable Diffiusion это хорошо :)
(некоторым) худолжникам не нравится что творит StabilityAI с Stable Diffusion (но при этом в среднем худшего понимания КАК это работает — больше бреда в заявлениях)...


:)
А общего — что надо как то такие вопросы законодательно урегулировать и чтобы не было у кучи людей мнения что найденное решение — ну бред же ПОЛНЫЙ и нафиг его испольнять(примерно как сейчас с копирайтом на фильмы) :)

"Это происходит и в том случае, когда он копирует чужой код сниппетами длиннее 150 символов непосредственно из определённого репозитория" - мне казалось там нейросетевой подход. Или это история в духе "программист изнасиловал автора статьи"? Если так, и Copilot ничего не копирует, а работает как обычная нейронка с весами, то почему бы юристам компаний не занять позицию аля: "Наш инструмент не содержит в себе ни строчки опен-соурс кода. Он работает как человеческий мозг, делая выводы из прочитанного опен-соурс кода(а чтение не запрещено ни одной лицензией), и далее на основе полученных знаний он решает как писать код(как человек). С таким же успехом программистам можно подать коллективный иск на самих себя, ведь принцип работы человеческого мозга(если утритроровать) точно такой же."

делая выводы из прочитанного опен-соурс кода(а чтение не запрещено ни одной лицензией), и далее на основе полученных знаний он решает как писать код(как человек).

А то, что в итоге написанный код совпадает с прочитанным, ничего не значит, потому что семантически это разные тексты, созданные в результате совершенного самостоятельного акта творчества.[1]

  1. Х.Л. Борхес. Пьер Менар, автор «Дон Кихота».

Он работает как человеческий мозг, делая выводы из прочитанного опен-соурс кода(а чтение не запрещено ни одной лицензией), и далее на основе полученных знаний он решает как писать код(как человек)

А вы никогда не слышали про юридические сложности, возникающие, например, при реверс-инжиниринге и воспроизведении функциональности чужого кода с не абсолютно permissive лицензией? То есть clean room design - это буквально устоявшийся термин в индустрии как раз из-за этого.

В общем, если очень грубо: если вы взяли софтину А, писать свою аналогичную софтину Б, прямо ориентируясь на поведение софтины А и пытаясь воссоздать его 1-к-1 без разделения полномочий и доступа к информации - верный способ напороться на copyright infringement lawsuit от авторов софтины А с хорошими шансами его проиграть и заплатить этим авторам круглую сумму.

Слышал, только причем тут Copilot?

Притом, что, цитирую, "Наш инструмент не содержит в себе ни строчки опен-соурс кода. Он работает как человеческий мозг, делая выводы из прочитанного опен-соурс кода" - буквально то, что в симметричной юридической практике для продуктов с несвободной лицензией трактуется как copyright infringement. "Смотрите, так делает человек, значит, и копайлоту можно" - странная защита, когда человеку так в юридической практике не можно.

Я правильно понимаю, что вы буквально пишете следующее: "Ни человеку ни нейросети нельзя писать код т.к. это нарушает чью-то лицензию."? Потому что ЛЮБОЙ код по такой логике нарушет лицензию. Ладно, давайте скажу все прямо, а то метод Сократа в онлайн переписке с такой задержкой между ответами слишком непродуктивен. Человек учит программирование читая чей-то код который под лицензией, куски кода из книг которые под лицензией, изучая курсы код которых тоже под лицензией. Потом на основе собранных обобщенных зананий пишет свой код. Всё что вы читаете - влияет на ваше поведение в будущем, на результаты вашего труда. И если вы хотите чтобы люди не использовали код под лицензией не нарушая лицензию, нужно в лицензии прописать запрет на чтение этого кода. Другого способа решить проблему впитывания знаний мозгом чтобы они не влияли на будущий программный код который будет писать человек или нейросеть - нет.
Это во первых. Во вторых, вы просто заблуждаетесь считая что то, что пишет Copilot нарушает лицензию именно вашим описанным способом, потому что чтобы доказать это в суде вам нужно будет доказать что Copilot имел умысел в копировании чьего-то кода. Удачи вам в доказывании того что нейросеть имела какой-либо умысел.
Если же вы считаете что Copilot прочитав чей то код под лицензией, далее будет его копипастить в своих ответах - то вы просто не знете как работают нейросети.
Вы приводите пример с риверс инжинирингом программы - я вам говорю что ваш пример не имеет ничего общего c текущей статьей и Copilot потому что Copilot не так работает.

Есть много вещей которые трудно реализовать способом который отличается от уже всех ранее использованных (без ущерба читаемости или производительности).

Возьмите 10 разработчиков которые незнакомы друг с другом но имеют примерно одинаковый опыт и используют один ЯП, и попросите реализовать (к примеру) алгоритм быстрой сортировки по предоставленному описанию "без отсебятины" (типа оптимизаций) - вы получите 10 разных реализаций?

Если же их будет менее 10 (разные имена переменных и стиль типа отступов, расположения скобок и т.п. не будем считать отличием) - то у кого будет приоритет и кто у кого "списал"?

Clean room это здорово но есть вещи которые очень трудно реализовать кардинально иначе, например если мне нужно выдавать на выходе сумму элементов массива - деваться некуда, наверняка кто-то до меня сделал это ровно также как и я, с погрешностью в стиле кода и поправкой на архитектурные оптимизации (если они вообще допускаются).

Даже если опустить всё более-менее тривиальное, код для решения одинаковых задач (в пределах одного ЯП и библиотек) будет очень похожим, настолько что тривиальные изменения могут сделать его идентичным в большинстве реализаций.

Так и к копайлоту вряд ли по факту претензии за квиксорты.

Не понимаю, к чему вы вообще, если честно. :)

Даже если опустить всё более-менее тривиальное, код для решения одинаковых задач (в пределах одного ЯП и библиотек) будет очень похожим

Ну, ээ, нет, особенно если взять в расчёт накапливающуюся разницу в архитектуре (и более низкоуровневой структуре) разных решений.

Быстрая сортировка как раз всем известна. Вот если бы задание было реализовать новый никому не известный способ сортировки, то у 10 разрабов они были бы разные.

Вот совершенно совковое понимание кода принадлежащего комьюнити -"Всё вокруг колхозное, все вокруг моё" 

лишь бы "совок" приплести, даже если в контексте "майкрософт, копилот и американский суд"))

отмывание открытого исходного кода

Микрософту надо было пропускать код, полученный от Copilot, еще через миксеры, типа тех, что крипту блендируют. Чтобы избежать юридических последствий.

По авторским правам могли бы не обламываясь, вставлять в комментарии над этим куском "украденного" кода, откуда он взят, автор, кратко. Было бы интереснее и меньше проблем. А если пользователь удалил потом, то это не их дело и ответственность. Вообще было бы интересно, из какого репозитория контекст, естественно для больших его частей. Но, они выбрали трудный путь обезличивания, хотя код и так распознали.

Так нет никакого "украденного кода". Проблема в данном случае скорее в том что код используется для обучения ИИ. Один в один никто код не копипастит.

ИИ это производное произведение, он не обладает самостоятельностью в юридическом смысле. Отсюда иски и к Copilot и тем нейронкам про картины и тексты. Они полностью обоснованны - небыло бы исходных картин и текстов написанных всеми этими людьми - не было бы нейронки

Обоснованно или нет это другой вопрос. И тут как мне кажется суды будут развлекаться много лет. И скор всего придётся законы менять.

Речь о том что претензии не в копипасте как таковой.

Текущие законы полностью рабочие, их хватает. Просто не применяли еще для таких целей

Это технически невозможно. Информация в генерирующих ИИ проходит через нереверсируемый алгоритм, через кодирование с потерями. Обратно проследить из каких исходников происходит полученный результат можно, но с кучей шума, с точностью "ну вот с вероятностью 0.9 основой послужил исходник из этих десяти тысяч."

Даже это я пожалуй оптимистично загнул. Я не знаю как устроен Copilot, но на примере StableDiffusion, на решение влияют в некоторых долях все изученные исходники. Влияние большинства из них микроскопично. На разных шагах разные источники оказывают влияние. То есть, можно получить список картинок, которые на каждом шаге произвели наибольший эффект на результат. Вот только это будет не список оригиналов - их в сети нет, и не список номеров оригиналов - их нет тоже, а очень примерное "воспоминание" сети о том, что там было. Исходники весят полтора петабайта, а сетка - полтора гигабайта, и результат такого реверса будет выглядеть именно как изображение, ужатое так, чтобы уместить петабайт в гигабайт. Чтобы определить, что это было - нужно всего лишь пробежаться по всем полутора петабайтам закодированных исходников и определить наиболее похожий. И так 50 раз, для каждого шага. И всё равно есть вероятность, что картинка для человека будет похожа не на ту, которую сеть сочтёт самой важной.

Короче, сложность такой операции, имхо, на порядки превзойдёт саму работу AI.

@Kanut , (чуть промазал с комментом)

Имею ввиду в отношении

Это происходит и в том случае, когда он копирует чужой код сниппетами длиннее 150 символов непосредственно из определённого репозитория. Система специально не указывает авторство исходного фрагмента кода.

То есть местами все таки проглядывает откровенная копи-паста. По моему мнению, им все таки нужно было здесь указывать откуда он взят, если лицензия позволяет продавать.

Это не поможет.

Практически все комментаторы не видят или не пожелали обсудить, мне кажется главную проблему, из-за которой и появился этот иск. copilot и аналоги — это инструмент очистки (отмывки) кода от лицензии (в данном случае opensource) исходных данных, на которых обучалась нейронная сеть, с последующим его использованием в, например, проприетарных продуктах, без возврата наработок в опенсорс.

Т.е. видим открытый продукт, в котором реализован интересный и очень эффективный алгоритм, решающий нашу задачу, но если мы добавим этот код в свой продукт, закон вынудит открыть его исходные коды, что может сильно уменьшить или даже уничтожить возможность получения выгоды… берем copilot, и получаем почти тот же самый код (можно даже под видео запись, для совсем ушлых адвокатов), но уже очищенный от 'заразности' открытого кода.

В первую очередь от этого пострадает opensource, да косвенно, да это еще один из многих способов/инструментов такой очистки,… факт есть факт, это становится проще и решение этого суда может значительно изменить ситуацию и даже сломать идеологию opensource, совершившую переворот в индустрии.

p.s. как пример красивого решения, может оказаться буквальный запрет использования таких инструментов, если он не добавляет информации об авторе и лицензии участков кода, на основе которых получена подсказка. Да, исполнить такой запрет будет невозможно (кто угодно может повторить создание такого продукта), и это возможно будет не всегда (ухудшение использования) или создаст на столько сложную и противоречивую комбинацию используемых лицензий, что никакие другие варианты лицензий кроме открытых в итоге получить будет нельзя.

Мне кажется рынок (или даже мир в целом) не готов к тотальному открытому коду, как минимум, пока существует чистая капиталистическая модель общества (как основная причина и принципиальный смысл проприетарных лицензий) и вообще решения в этом направлении вредны для капитализма, поэтому эти компании и направили свое прошение — не лезьте в эту тему, все сломаете.

Это все понятно, но не зря привел цитату, кроме того по ссылке в статье подробнее дублируется на чем основан иск. Вот цитата еще раз.

Это происходит и в том случае, когда он копирует чужой код сниппетами длиннее 150 символов непосредственно из определённого репозитория. Система специально не указывает авторство исходного фрагмента кода.

В цитате явная конкретика, пусть и в каких то редких случаях код берется без изменений, что явный косяк. Отсюда и иск.

Хм.. а разве в решении "оракл против гугл" не было отдельно указано, что решение не создаёт прецедента?

Sign up to leave a comment.

Other news