Pull to refresh

Comments 70

Вот насчет юридической чистоты я сомневаюсь. Яндекс известен тем, что составляет очень удобные для себя соглашения которые работают до тех пор пока все зажмуриваясь отворачиваются в другую сторону, потому что так принято.. И сломать эту стену крайне непросто (и дорого), но после образования первой дырки, бартер быстро рассыпается.

А кто-то может накидать кейсов, судов, ссылок? Интересно аж стало.

Ищите по именам "Яндекс Такси" и "Елена Гращенкова " - человек чуть ли не в одиночку сломал в судах позицию "Яндекс это просто информационный сервис, который ни за что не отвечает и никому ничего не должен ."

Елена молодец. Как говорится, самый справедливый суд в мире.

По моему мнению, всё упирается в законодательство об авторском праве.

Созданный интеллектуальный продукт не может быть в исключительной собственности коммерсантов и частных лиц.

Моё личное мнение такое, что надо делать для максимум для всех людей, когда это можно сделать малым ресурсом. В частности по этой логике - когда мы считаем это разумным - мы выкладываем свои модели.

Аналогичное ощущение сложилось, когда я искал нормальные наборы данных по русскому языку.

Получается типичная ситуация, в которой налогоплательщики не могут получить доступ к общественному благу, которое было профинансировано из их кармана.

В этом вся соль статьи.

Интересно, будет ли реакция Яндекса и чиновников. Хочется знать не что они думают, а что они собираются сделать чтобы доступ к корпусу был полностью открытым.

IMO на сайте должна быть актуальная torrent ссылка на весь корпус и производные, без смс и регистрации.

На самом деле НЕТ такого положения, что в результате гос.финансирования получается общественно достояние. Государство вполне может давать безвозмездные гранты на развитие областей, которые считает ключевыми, но не получать доли госсобственности и уж тем более не передавать продукт в общественное достояние.

Это вопрос даже не законодательства, а идеологии. Вполне распространена версия, что государство неэффективный собственник и индустрию надо развивать поддерживая лидеров индустрии. А государственное, а уж тем более общественное - это пережитки совка и синоним стагнации.

А нас вполне либеральное государство в этом плане.

Это кстати правда. Иногда грант выдается, просто чтобы ты что-то сделал и отчитался. Но такая большая "штука" просто не может никому не принадлежать.

Знаете, среди современных гос.чиновников РФ я наблюдаю активную секту "цифровизаторов", которые продвигают именно озвученную мною идеологию государственно-частного партнерства. Из других примеров можно привести, например, скандал вокруг навязывания мессенджера "Сферум" через региональные управления образования.

Мне кажется это сигнал к постепенному принятию идеологии гос.капитализма на государственном уровне.

Полагаю здесь так же все формально относительно чисто. За подробностями надо читать контракт...

Ну даже в образце либерализма США вовсе не считается, что что-то профинансированное на деньги налогоплательщиков можно от них закрыть. Вот последние вести с американских полей по этому поводу:

As per the guidance, all US federal agencies must put in place policies and plans so anyone anywhere can immediately and freely access the peer-reviewed publications and data arising from research they fund.

что-то профинансированное на деньги налогоплательщиков можно от них закрыть

А квартира, купленная по программе льготной ипотеки, т.е. субсидированная государством, тоже является общественным достоянием?

О, ложные аналогии в чате). Вы еще спросите "А если кто-то получил от государства еду по талонам, можно я эту еду отниму и сам съем?".

На самом деле пример с квартирой очень даже уместен. Одно дело, когда вы просите помощи у государства, чтобы было где жить. Другое дело - если вы приходите в госучреждение и говорите "У моей семьи хата уже есть, дайте денег на ипотеку для еще одной, мы ее сдавать будем и стричь бабло" - тут вас развернут сразу.

Это как раз и есть разграничительная линия, как мне кажется. Т.е. некая компания с помощью госфинансирования что-то разработала, а затем за статьи об этом исследовании просят денег. Особенно тот же elsevier радует своими расценками на статьи, особенно 50-летней давности. Государство как инвестор имеет право на доступ к результатам исследования, и как инвестор имеет право раскрыть эти результаты тому, кому подотчетно - в данном случае налогоплательщикам. Если не нравится - исследуйте на свои, и потом просите за публикации об этом денег.

UPDATE. Кстати, правила ипотеки зачастую прямо запрещают пытаться сдавать в аренду жилье, купленное в ипотеку - вот пример Нидерландов. То есть да, прямо общественным достоянием такое жилье не является, но и просто так распоряжаться им без разрешения кредитора Вы не можете

По льготной ипотеке пока не выплатишь, квартира в залоге, то есть не твоя. Так что не надо тут. И платишь ты за нее свои деньги, просто процент тебе частично "прощают".

Как это "прощают"? Ничего не прощают, оплачивают из моих налогов.

Залог не делает собственность не твоей.

Формально да. Но есть один нюанс ... Продать ты не можешь. Не заплати банку - и узнаешь - твоя она или нет.

Залог не меняет собственника. Иначе все, что можно отобрать по суду - не твоё.

Это замечательно, но несколько про другое. В общественное достояния, если я правильно понял, переводятся публикации об исследованиях, а не сами результаты. Это скорее про судебное преследование проекта Sci-Hub и идеи его организатора Александры Элбакян

Это плод какого-то недопонимания терминологии, даже если учесть, что это только пожелания на 2025 год. Я даже не буду спрашивать, где немедленно и свободно можно ознакомиться с документацией на термоядерную боеголовку W88. Но и вообще никаких нетривиальных технических расчётных данных никто никому не даёт.

С экспериментальными данными NACA вполне можно ознакомиться. Очень даже нетривиальные технические данные.

Вы корпус языка ещё бы с секретными данными разведки бы сравнили.

Попробуйте найти хотя бы точную модель гравитационного поля Луны и планет в численном виде. Только зашитые в библиотеки с закрытым кодом.

Обратите внимание, что доступны там модели до 900 точек, а сами они работают по 1200 точкам. И почему-то 2.5 Тб данных по 900 точкам, 711 Гб по 660 точкам и т.д. они сочли возможным выложить, а 8 Тб по 1200 точкам оказались “extremely large [...] and was not archived”.

Коэффициенты гравитационного поля там доступны до 1200 порядка, а 900 порядком ограничены только сохранённые матрицы ковариации. Я не работаю с моделированием гравитационного поля Луны, поэтому не уверен, насколько данный конкретный продукт критичен с точки зрения применения этих данных, но у меня не создаётся впечатления целенаправленного сокрытия информации.

Я тоже не работаю с этим вопросом, но слышал мнение специалистов. Проблема существует.

В целом, гравитационное поле Луны очень неравномерно, и малейшие вариации оказывают большое влияние на орбиты космических аппаратов.

А государственное, а уж тем более общественное - это пережитки совка и синоним стагнации.

Например, НАСА выкладывает медиа в открытый доступ и разрешает их использовать бесплатно. Там какие-то ограничения только на фото людей, насколько я помню.

На JPL сайте по марсианскому вертолету отчеты с огромными таблицами экспериментальных данных. Там же продувки квадрркоптеров в трубе. Выкладывают все что гос. заказчик требует.

На свои деньги яндекс может делать что вздумается.

Оплата частных интересов из общественного кармана - это ненормально. В этом идея статьи, как я понял. И я с этим согласен.

Интересно другое:

Странно что статья с этой идеей появилась в 2023м, после тысячи дней отсидки того, кто посвятил жизнь продвижению этой же идеи.

С одним сидом с отдачей 16 kb/s

да и не страшно, если есть другие сиды, достаточно отдать каждый кусочек по одному разу, другие сиды сами друг с другом поделятся

Пока я написал в минцифры, они вроде активно впрягались за подданных в 2022 году.

Попробовал заманить челика из нкря, кто активно комментировал нашу позицию в чате как "агрессивную и малообразованную", но он пока не реагирует.

Мне думается, надо курить договор к грантовому соглашению. В таких документах четко прописываются права на получаемый продукт, а также количество выпускаемых объектов интеллектуальной собственности (тех же отчетных статей и патентов, например). То есть, с самого начала там как по прописи должно быть указано, на что выделены государственные деньги, какие ожидаемые результаты, кто их правообладатель. Но такой договор вряд ли видел кто-то, кроме участников и утверждающих чиновников министерства.

Умора будет, если окажется, что формальный правообладатель - казахская компания.

Израильская же, с казахскими корнями =)

Должно - не значит указано, вон Счетка провела ревизию и внезапно выяснилось, что государство не обладает достаточными правами на оплаченный за госсчет "Гостех", гы.

Если здесь бывают лица с удостоверениями журналистов и читают комменты, у меня к вам вопрос.
Как думаете, поможет ли журналистский запрос, например в РАН, для поиска ответов на вопросы в контексте статьи, которые я выделил в цитату?

на что выделены государственные деньги, какие ожидаемые результаты, кто их правообладатель

Интересно, что корпус назван "национальным". Надо было назвать просто КРЯ.

Что касается корпуса ударений, думаю, не вам одним он был бы полезен. Может, кинули бы клич, да объединили усилия с другими компаниями и исследователями. Для акцентуированного корпуса не нужно так много усилий, как вложено в НКРЯ.

Видимо, "КРЯ" звучит слишком по-утиному?

Там в разделе контакты находим новое юрлицо - ООО "Национальный корпус русского языка".

и там же уже находим НП и внизу приписку:

Обновлено

20.10.2023

Совпадение? Не думаю...

В ЕГРЮЛ почему-то учредители этого НП не указаны

Верный признак, что это физики, а не юрлицо и обратите внимание на запись в строке 81 выписки:

Представление сведений о регистрации физического лица по месту жительства

Впрочем, речь может идти и о директоре.

Но пользовательское соглашение естественно это прямо запрещает

Мне кажется, Вы пропустили одну деталь: в какой момент у НП возникают авторские или смежные права на НКРЯ и оно становится правомочно что-то запрещать? Получение финансирования на содание корпуса таким моментом ни секунды не является самом по себе.

Я бы на Вашем месте запросил инфу на основе 8-ФЗ у того, кто спонсировал весь этот праздник за бюджетный счет.

А у кого запросить, и должны ли мне ответить?

Как следует из приведенного Вам релиза, запрашивать следует Минобрнауки, т.к. бюджетные деньги выделялись через них. Ответить обязаны в пределах информации, произведенной или находящейся в распоряжении Минобрнауки (см. закон). А вот как Минобрнауки будет в данном случае творчески интерпретировать требования закона, предсказать не берусь.

Надо разбираться в правовой и финансовой структуре этого проекта. Пока что описанное в статье очень напоминает государственно-частное партнёрство. Если это так, то понятно, почему имеющие коммерческую ценность результаты не выдаются другим организациям, кроме соинвестора (концессионера?). Условно, работали программисты яндекса на оборудовании яндекса – яндекс и получил доступ к результирующим файлам на каких-то условиях. А государству в таком случае важно только то, чтобы результаты были сохранены и ими пользовался Институт русского языка. Как коммерческая автодорога, по которой бесплатно ездит полиция. Но это просто мои предположения.

Тут можно при желании дойти до глубочайших софистических размышлений, вплоть до того, является ли нормативный русский язык интеллектуальной собственностью общества или государства. Языки программирования, вот, вообще часто находятся в частной собственности.

UFO just landed and posted this here
UFO just landed and posted this here

Всю статью можно сократить до одного скрина:

На домене yandex.ru почту может зарегистрировать кто угодно, это примерно как считать сотрудником VK любого пользователя с адресом на mail.ru

Хм, был неправ, давненько не пользовался почтой на яндексе...

По лицензионным соглашениям, представленным на странице...

Ну, у них, по крайней мере, эти лицензионные соглашения есть. А вы в прошлой теме так и не ответили, где посмотреть ваше и написано ли там, что вы будете читать и использовать по своему усмотрению тексты пользователей. Может, сейчас подскажете?

Раз уж подкатила такая языковая оказия, подброшу ещё языковую тему для обсуждения, давно интересующую меня. Заинтересовало, кем и каким порядком происходит управление массивом языковых данных, который является основой для интернет-словарей и интернет-переводчиков. А возник этот интерес, когда я попытался разобраться, каким образом простой пользователь может повлиять на наполнение этих словарей, или исправить пролезшие туда ошибки. Ведь никаких кнопок с надписью "Техподдержка" в этих словарях и переводчиках нет. Куда писать? На деревню дедушке?

Ну например, как правильно: "флешка" или "флэшка"? По мне, второй вариант правильнее (хотя бы потому, что он вернее соответствует звучанию русской речи), но интернет-сервисы правильным помечают первый и зачастую автоматом исправляют второй. А поскольку интернет пронизал всю нашу жизнь, то диктуемое им, будучи правильным де-факто, через некоторое время становится правильным де-юре, причём через головы всяческих официальных лиц типа составителей академических словарей и пр., что бы там они ни писали в этих своих словарях.

Теперь - к печальной практике жизни. Откуда интернет-сервисы берут себе право влиять на развитие "великого-могучего"? Да что там сервисы, там ведь конкретные люди сидят на техподдержке этих словарей и переводчиков. И если в случае с Яндексом, пусть и с неимоверными трудностями, до этих людей как-то можно докопаться, то как достучаться до тех, кто ведёт аналогичную деятельность в Гугле? А если добраться до них нельзя, то получается, что текущей деятельностью по поддержанию русского языка управляет неизвестно кто, сидящий неизвестно где, но уж точно не в России. По-моему, это недопустимо.

Правильное написание слова "модем" никак не мешает правильному произношению через "э".

Всегда было интересно, а за чем сначало учить "правильно" писать, а потом ещё и учить "правильно" читать/произносить. Может всем будет проще сразу делать и то и то просто правильно? Ответ - так исторически сложилось конечно все объясняет, но тогда где же наши твердые знаки на концах слов и прочие "правильные" вещи?

Может всем будет проще сразу делать и то и то просто правильно?

Давайте:
"... а зачем сначала...", "... и то, и то..."

Где же наши твердые знаки на концах слов?

Сейчас вместо них пробелы (разделение слов). Твёрдые знаки нужны были для записи на бересте, чтобы экономить место (бересту сложно было делать): некоторые слова твёрдые знаки на конце не требовали, т.к. понятно как разделить слова, поэтому символов было меньше, чем если использовать пробелы. Затем этот же текст начали печатать в газетах, а там экономия была обратной - нужно было экономить чернила, поэтому стали вместо твёрдых знаков использовать пробелы (бумагу делать проще/выгоднее, чем чернила).
В век компьютеров можно писать любые символы и любое их количество - электроны "дешёвые", экраны переиспользуемые.

...так исторически сложилось...

Первичны слова и звуки. Затем это нужно было как-то уместить в разумное кол-во букв. Разумное это сколько? Минимально возможное, чтобы не было путаницы что за слово при прочтении в контексте, но и чтобы произнести его можно было "правильно" (если знать правила), чтобы другие люди, знающие такие же "правила", могли его понять.
Поэтому в разных языках в алфавитах сильно разное количество букв - там разная фонетика. И чем более сложнее фонетика и проще правила чтения, тем больше различных символов для записи слов (египетские иероглифы, китайский язык, японский язык).

Наоборот: английский язык - мало букв, сложные правила чтения, простая/короткая запись слов, уникальные смыслы задаются и уникальными словами, и сочетаниями слов (фразовые глаголы, залоги), порядок слов в предложении фиксирован;

немецкий язык - букв чуть больше, правила чтения проще некуда, запись слов и их чтение - затруднительны, много диграфов, триграфов и так далее, правила словообразования простые, уникальные смыслы часто задаются разным сочетанием слов (или составными словами), а не уникальными словами, порядок слов в предложении фиксирован.

Промежуточный вариант: русский язык - правила чтения несложные, букв относительно "много", правила словообразования сложные (очень много форм слов), правила сочетаний слов - сложные, уникальность смыслов передаётся в т.ч. сложными формами слов (иногда форм достаточно, неважно какие корни, мат поэтому так популярен, и поэтому же запрещён), неуникальные словоформы приобретают свой смысл в контексте, в правилах много исключений, порядок слов в предложении в общем случае неважен, иногда встречаются фразы, когда это влияет на смысл (при неизменности словоформ), ударения могут влять на значения слова.

В китайском языке фонетика не имеет никакого отношения к лексике (кроме правила “один знак – один слог”). Да и нет общей китайской фонетики.

Ну тут разрешите позанудствовать. 10% иероглифов образованы по фонетическому признаку, а 80% по смысло-фонетическому.

Буквально вчера во вьетнамке купил напиток с манго, и там было написано 芒果, что по ключам можно разобрать как трава, смерть, поле, дерево.

Первый иероглиф значит занятый с ключом трава / растение, второй плод. Но фишка в чтении - занятый читается как mang. Получается оказалось, что китайцы подобрали свое слово занятый, чтобы звучало как манго. Конечно там есть тона и оно читается как mángguǒ, но суть не меняется.

Ну, может, с никаким отношением я и несколько увлёкся, но согласитесь, что ключ всё равно не кодирует фонетику. Он просто намекает, что одно слово читается подобно другому.

Что касается манго, то тут, мне думается, история другая. Всё-таки это растение тропических джунглей, не встречающееся в природе в коренных районах Китая. Разве что на Хайнане и Тайване оно могло исходно расти. Поэтому mangguo – заимствованное у тропических народностей слово (википедия подсказывает, что исходным является малайское “мангга”). А китайцы, записывая его, просто зафиксировали, что оно звучит похоже на слова “занятый” и “плод”. Ну и в вопросе происхождения старых китайских слов нужно, конечно, смотреть вэньянь.

Не совсем верно. В старорусском языке все слоги были открытыми и твёрдый знак обозначал редуцированное о - краткое о. И он вполне читался.

Когда-то, будучи школотой, я мечтал провернуть реформу русской орфографии (и не только русской). Потом вырос, окончил универ, и смирился =)

А я не мечтал, я просто писал и пишу так, что бы было понятно, а не что бы кому то угодить с правилами, ну и соответственно принимал последствия, 2/3 моя высшая оценка по сочинению, зато мне так было намного проще чем если бы я заставлял себя писать "правильно"

Sign up to leave a comment.

Articles