Как стать автором
Обновить

Энтузиаст выложил часть исходного кода Twitter в GitHub, соцсеть заблокировала репозиторий и потребовала раскрыть автора

Время на прочтение2 мин
Количество просмотров21K
Всего голосов 9: ↑7 и ↓2+12
Комментарии69

Комментарии 69

Все что попало в интернет, остается в интернете.
Так было раньше и я надеюсь так будет и впредь!
Аминь!

А там уже не в этом вопрос.

Первое, они хотят выяснить кто это сделал, и дать ему по голове очень больно. Чтоб другим не повадно было. Второе, они хотят заблокировать использование утекшего кода компаниями. Т.е. втихую посмотреть можно будет и никак с этим не справишься. Но вот если кто-нибудь рискнет хоть что-то позаимствовать - будет плохо.

Т.е. они стремятся сделать утекший код максимально токсичным, чтоб никто не хотел связываться.

И кто же об этом узнает? Это же не опенсорс.

Когда компания выходит на IPO, ее код смотрят независимые эксперты. Будет плохо, если перед самым IPO выяснится кража кода.

Когда компания выходит на IPO, ее код смотрят независимые эксперты.

Что за фигня?! Никогда такого не будет. Плюс. А компании, которые уже на IPO - они тоже постоянно каким-то экспертам показывают свой код? Вы постоянно проверяете исходники Windows(а)? И ещё - у ваших независимых экспертов имеются все исходники всех программ мира чтобы проводить проверку? Не надо говорить глупости.

Скорее всего twitter сам переживает, что в их исходниках что-то чужое найдут.

Думаю, что оно чуть по другому работает. Если в компании есть ворованный код (или пиратский софт используется), то это делает ее куда более уязвимой перед собственными сотрудниками, которые могут создать проблем, если их ломать через колено. Особенно, в странах, где whistleblowing законодательно защищен.

Там есть значительная доля правды. В коллекции момент роста, обычно при покупке/объединении компаний действительно заказывается аудит, который в том числе оценивает и лицензионную чистоту кода. Во многих случаях это и перед выходом на IPO делается, в зависимости от того, чем занимается компания.

Цель этого всего- оценить интеллектуальную собственность, так как для IT-компаний это основной актив. В том числе и с точки зрения юридических рисков. А без оценки только очень хайповые компании могут инвестиции привлекать.

Эмн, ну вот я спер половину кода у твитера, половину у MS. Нарушил не только смежные права, но и авторские. То есть затер комменты, указывающие на авторов. Как можно проверить этот код на лицензионную чистоту не получив сырцов у твитера и MS?
Кажется максимум что можно проверить (в реалиях того, что я вижу в РФ разработке вокруг себя) — наличие служебных заданий на создание всего кода, что есть в кодовой базе и заявляется как собственный.
Ну и совместимость лицензий для кода заявленного как заимствованный, но это не тема обсуждаемой ситуации.

Господь бог, кто вам такое сказал-то?

И для чего вы будете использовать код Твиттера, чтоб об этом никто не узнал? Сделать свой приватный Твиттер под кроватью?
Во-первых, ваши инженеры узнают. И некоторые решат не молчать об этом.
Во-вторых, если захотите продаться, то есть такая штука как аудит кода. Судится по поводу прав на интеллектуальную собственность дело дорогое. Проще аудит на чистоту пройти.
В-третьих, код придется поддерживать. И вам придется бывших инженеров Твиттера нанимать, чтоб во всем этом разобраться. Это тоже привлечет внимание.

Короче, если вы примените утекшее в чем-то серьезном, то со временем это выплывет.

Можно же переписать "своими словами", достаточно лишь увидеть идею лежащую за строками кода.

В коде Твиттера нет ничего настолько уникального, чего бы не смог придумать Ваш архитектор.

Так можно сказать про любую библиотеку или пакет и начать делать свой велосипед. Набить все шишки и собрать все грабли по которым уже успели пройтись

Взять чужое легаси с кучей набитых шишек (да ещё и без истории в виде каких-то тикетов и обсуждений в pr-ах, а так же без живых разработчиков, имеющих хотя бы минимальную экспертизу в этом коде) и разобраться, а какие же шишки, да где набиты - не сильно проще)

Можно подсмотреть например что-то инфраструктурное, как они скэйлятся при пиковых нагрузках, можно что-то алгоритмическое, как они формируют ленту рекомендаций или еще что-то полезное

Вы прямо уверены, что найдёте там что-то, чего не будет в заопенсоршенных твиттером продуктах, статьях в техноблогах от сотрудников твиттера отдельно или в общем-то от твиттера, статьях в профильных издниях, видео с выступлений на профильных конференциях, или каких-нибудь книжках от текущих и бывших сотрудников твиттера про то, как делать масштабируемый веб и про то, как проходить всякие system design секции?

Лично у меня пока сложилось впечатление, что контента такие компании (особенно, компании из числа тех, которые немного тянут индустрию вперёд и одновременно с этим заботятся о формировании HR-бренда) генерируют больше и быстрее, чем средний разработчик успевает потреблять.

Попробуйте такое провернуть с утёкшим исходным кодом яндекса и что-то там такое найти) Ну, из разряда "простая для понимания, но секретная идея для масштабирования чего-либо, которой почему-то решили не хвастаться, а сохранить в тайне".

С тайнами в области "методов и подходов" вообще сложновато, учитывая, что сотрудники между такими компаниями регулярно ротируются.

У яндекса очень много интересного нашли по алгоритмам ранжирования поиска, нашли что у Алисы были незадокументированные возможности (вот прям неожиданно, шок контент ))). Это первое что мне вспомнилось. Но это конечно не относится к каким-то решениям или что можно было бы применить.

А так, почему нет, возможно все таки они не всю кухню на опен сорс отдавали

У яндекса очень много интересного нашли по алгоритмам ранжирования поиска

насколько я помню, нашли какой-то тестовый c-шник с наборчиком факторов, который в ранжировании, собственно, и не используется)

Про все "интересные" и описываемые человеческим языком факторы там SEO-сообщество говорило и в года, эдак, 2010-ые.

Сам алгоритм - в общих чертах, не тайна и внутри много машинки)

Помню, лет пять-десять назад в радио-т бобук, в бытность когда-то ещё сотрудником яндекса рассказывал, что в общем-то не проблема выписать в слайд какой-ниьбудь seo-конфренции мелким шрифтом (чтобы уместилось) полную итоговую формулу ранжирования с точным значением каждого коэффициента - толку-то, если все коэффициенты - это выход чёрного ящика (на тот момент ещё матрикснета, сейчас не знаю) и регулярно пересчитываются, а факторы постоянно добавляются и убираются.

Сейчас, наверняка, при обучении используются нейроночки с которыми те же самые сотрудники яндекса выступают на конференциях, и CatBoost вместо матрикснета, который целиком заопенсоршен. Изучай эту науку, не хочу.

Можно ещё в ШАД поступить и бесплатно про эти самые нейроночки и машинку послушать от тех же самых сотрудников)

Алисы были незадокументированные возможности (вот прям неожиданно, шок контент ))).

Раскатанная на сотрудниках фича, неприятная, да)

---

Однако - все примеры выше - это не про то, чтобы из этого можно было чему-то научиться и переиспользовать. Это про то, чтобы найти повод для хайпа, скандала или поискать нарушения / уязвимости. И с тем, что так исходники можно поиспользовать - я ни разу не спорю)

Наоборот, добавлю, что наверняка злоумышленники смогут придумать много креативных применений слитым исходникам. Можно, например, в полуавтоматическом режиме отдельные микросервисы fuzz'ить)

---

А вот что про научиться и переиспользовать:

А так, почему нет, возможно все таки они не всю кухню на опен сорс отдавали

Ну вот у вас код пяточка микросервисов, которые реализуют переключение какой-нибудь внутренней фигни для специфичной для твиттера фичи, по принципу какого-нибудь стандартного для индустрии паттерна (ну там какой-нибудь хитрый процесс между несколькими сервисами оркестрируется через сагу).

Что вам детали реализации этих микросервисов дадут?)

  1. Это код написн людьми, нанятыми несколько лет назад, уволенными чуть позже, и дописан нанятыми другими. Общая кодовая база много лет живёт с условием того, что люди приходят и уходят, и дописывать и поддерживать это нужно пришедшим с улицы таким же ребятам в будущем. (т.е. маловероятно, что вы наткнётесь на какой-то код полный уникальных эзотерических оптимизаций, он бы не дожил, или бы эти оптимизации давно стали бы известны индустрии).

  2. При этом пишется в таких компаниях много вещей на лету, и, собственно, сама микросервисная архитектура не подразумевает, что много людей погружено во внутренние детали многих сервисов "с другого конца компании". Там будет много косяков, самоповторов и всего такого. Код никто не адаптировал для того, чтобы человек со стороны мог легко его читать. Вряд ли читая код с внутренними приколюхами вы разберётесь с архитектурой быстрее и проще, чем читая непосредтсвенно статьи и смотря конференции.

  3. "Мы сделали какой-то такой вот прикол, для того, чтобы было проще авторизовывать пользователей" - в индустрии не считается дофига нау-хау, который нужно скрывать - посмотрите записи выступлений на конфренециях - да каждая вторая кампания, наоборот, рада рассказать офигенную историю "А как мы делали ленту новостей по-своему, и почему нам пришлось делать так и не подошли решения предыдущих пяти докладов на ту же тему от других компаний". Внезапно, выступление на конференциях - это польза и компании и разработчику и индустрии, а энфорсить секретность здесь - не даёт никаких плюшек (и, строго говоря, энфорсить такое - прямо очень-очень сложно, я с ходу даже не могу представить, как)

  4. Сами люди, которые писали этот код, за очень-очень редкими исключениями - не какие-то передовые исследователи в области распределённых систем, а просто такие же разработчики, как и вы. (а если бы они и были ими - они бы, внезапно, использовали бы эту возможность для того, чтобы опубликоваться).

Так можно сказать про любую библиотеку или пакет и начать делать свой велосипед.

за редким исключением - успех идеи лежит только в коде. В большинстве своём оригинальность лежит в функциональности и способе её реализации через больше чем просто код. Конечно кое-что почерпнуть всегда можно - например реализацию через кафку, параллельнуюя обработку сообщений, поля, которые используют для сохранения данных, может быть структуру. И твиттер стал твиттер не потому, что они программировали так, как до селе невиданно. А именно идея во времени выхода и в системе, которая маленькими сообщениями позволяла доносить это до своих фоловеров. Сейчас - ничего необычного. Но они это сделали одними из первых и получили успех. Поэтому с этой стороны я-бы не придавал коду большого значения.

А вот то, что в твоём коде что-то найдут, что там находиться, но не должно - скорее всего за это переживает твиттер.

Именно какие-то решения могут быть больше интересны, чем реализация. Одно дело когда ты это спроектировал и реализовал. Потом интереснее становится когда надо обрабатывать уже не тыс, а млн сообщений, потом десятки млн. На каждом таком этапе становится прям сильно "интереснее" и "интереснее" )

Буквально книжки есть, которые рассказывают как устроен твиттер, и с какими проблемами им пришлось столкнуться. К примеру у Клеппмана в "Высоконагруженные приложения" есть разбор некоторых проблем.

да, читал и использую для своих лекций со студентами. Но кто знает, есть-ли капля правды в его описаниях? Может быть всё выдуманно, но звучит правдоподобно.

НЛО прилетело и опубликовало эту надпись здесь
И кто же об этом узнает? Это же не опенсорс.
Тут как раз в игростройной отрасли сейчас драма на схожую тему:
According to a report by Korean-based website ThisIsGame, Japanese game publisher Nexon claims that some Ironmace developers, who it says used to work for the company, took assets and code from a project it had in the works called «P3,» before leaving to make Dark and Darker.

As ThisIsGame says, if former Nexon employees did use code and assets to make Dark and Darker, this could be a breach of confidentially agreements and trade secret laws. The site says that Nexon «has reviewed legal action for this case, but it seems that it is contemplating how to respond.»

Не обязательно использовать, достаточно сделать аудит на закладки и дыры.
Но.. можно и поднять, например в том же китае - тёрки между китаем и сша всё растут, уже пошли отказы от патентов итд.. и всё, руки коротки. Если в корне не задавят, дальше бороться бесполезно. Это как с фото какой-то актрисы (эффект стрейзанд вроде), удаляют, удаляют.. а толку?

НЛО прилетело и опубликовало эту надпись здесь

Вообще интересно, есть ли сейчас варианты хранить информацию с абсолютной абузоустойчивостью? К примеру, распределенный протокол типа IPFS или BitTorrent + в блокчейне Ethereum ссылку прописать

НЛО прилетело и опубликовало эту надпись здесь

Из Китая или России спокойно можно было бы раздавать.

А вы думаете, Илон Маск не может пойти в российский суд? То, что Твиттер заблокирован в России, не отменяет авторских прав компании. То, что в марте 2022 нам разрешили пиратить софт недружественных компаний, так это если компания не хочет с нами работать. Твиттер на нас никаких санкций не накладывал. К тому же пиратство - это одно, а воровство коммерческой тайны - это вы не понимаете, это другое

Или, как вариант, контент будет запрещен как экстремистский, потому что разработан Твиттером

Пойти-то может, но... учитывая что Медведев уже прямо говорил что пора пиратить западный софт (если надо, найду пруфы) - вряд ли даже начнут рассмотрение. И авторские права ровно так же и идут лесом, нельзя пиратить софт, соблюдая авторское право. Более того, у Маска даже заводов в рф нет.

Опять же, ну начнут. "контора из сша без представительства в рф".. это что-то на птичьих правах на данный момент, а учитывая что уже были дела где западная компания как бы права, но выносили в пользу именно локальной...

Медведев уже прямо говорил 

Медведев сейчас занимает нишу Жириновского(хотя последний гораздо умнее был). Не стоить верить всему, что говорит придворный шут.

Есть! Раскладываете письма по конвертам. Если случается событие, письма кидаете в почтовый ящик и они уходят к адресатам.
Вопрос в инфраструктуре. Остались ли еще сервисы которых законодательно не обязали аутентифицировать абонента и хранить эту информацию? Почта (на отправку писем) и телефонные автоматы (в некоторых странах), вот пожалуй и все.
Еще относительно анонимно можно передать короткий сигнал в эфир. Но если заниматься этим регулярно, то отловят.

Банального torrent хватит.
Если материалы достаточно интересные, их за час скачает столько народу, что ловить их нужно будет сотнями в разных странах. Особенно «весело» будет искать скачавших в РФ.

Или на какой-нибудь российский сервис

Теперь это называется "энтузиаст" :))

В данном случае это название было выбрано на основе его ника на ГитХаб — FreeSpeechEnthusiast.

Не энтузиаст, а вор. Употребляйте слова корректно

НЛО прилетело и опубликовало эту надпись здесь

Это очень наивное представление, особенно в контексте компаний, результатом труда которых является интеллектуальная собственность.

Интеллектуальную собственность невозможно украсть.

Это вопрос терминологии. Если в законодательстве есть соответствующая статья защищающая права на нее — украсть можно. Так то можно дойти до того что в условном социализме без частной собственности у вас вообще ничего украсть невозможно, даже утюг, он же вам не принадлежит, кек.

Утюг-это личная собственность, его кража карается по закону, а вот частной собственности при социализме нет.

НЛО прилетело и опубликовало эту надпись здесь

Давно охранники на хабре сидят?

Оказывается все пробивы, слитые базы и подобные вещи вполне себе легальны - оригинал же продолжает оставаться у владельца.

Не легальны. (В общем случае, пока это НЕ относится к политике)
Но надо использовать правильные термины

А что не так с терминами? Если человек вынес код над которым работал (а помимо этого у него 100% еще и NDA есть) и опубликовал - разве это нельзя назвать кражей интеллектуальной собственности?

НЛО прилетело и опубликовало эту надпись здесь

Пример не корректный, все что вы перечислили это будет или нарушением патентов или товарного знака или чего-то в этом роде.

Если же развивать эту тему - то корректно будет сравнить что вы исходники оригинального того же Марио опубликуете в свободном доступе.

НЛО прилетело и опубликовало эту надпись здесь

Я уже написал выше почему считаю что не корректный, мне нечего больше добавить

НЛО прилетело и опубликовало эту надпись здесь

Самостоятельное создание новой игры про Марио (Самус) не является кражей
IP, так как вы не используете непосредственно код, алгоритмы или другие
материалы, которые принадлежат Нинтендо.

А каким тогда образом Blizzard'ы ухитряются закрывать пиратские сервера World of Warcraft и засуживать их держателей, если там используется полностью написанный с нуля эмулятор, а вся ИС Blizzard'ов находится у клиентов-игроков, а не на сервере (причём скачивают её игроки абсолютно легально с серверов самих Blizz'ов).

НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь

Не просто рисуют, но ещё и продают нарисованное, зарабатывая весьма значительные суммы. И, что интересно, нарушением авторских прав это не считают.

Зато когда кто-то заимствует уже их персонажей, начинаются вопли до небес. Бывает, до смешного доходит, когда художники начинают поднимать хай на весь deviantart, что у них украли позу персонажа. Т.е. нарисовали что-то своё, но в той же необычной позе, что на рисунке художника.

Двойные стандарты 80-го левела.

Фанарт - это пункт 4 того списка. Самостоятельно можно персонажа перерисовать.

А вот копипастить спрайт Марио в свой арт - уже будет проходить по пункту 5 или 6, в зависимости от платности арта.

Я бы поставил вопрос ещё шире - а какой ущерб вообще нанесла публикация этого кода? Это же не база данных или подобная чувствительная информация.

Чужое легаси - это вовсе не то, что можно взять и интегрировать в собственные разработки, сэкономив на этом деньги (тем более когда оно неполное, а лишь в виде небольших фрагментов). Проще написать с нуля, чем адаптировать это под себя. К тому же когда сливается приватный код, вы никогда не можете быть уверены, что там нет каких-нибудь запрятанных закладок, которые в нужный момент потрут вам всё содержимое БД.

То есть этот код абсолютно точно никем не будет взят в продакшн - себе дороже такое использовать.

Так в чём тогда ущерб, что твиттеровцы такой шум подняли? Это уже какая-то менеджерская паранойя. Они сильно переоценивают значимость своего кода.

Я бы поставил вопрос ещё шире - а какой ущерб вообще нанесла публикация этого кода? Это же не база данных или подобная чувствительная информация.

Теоретически, доступный код можно творчески с разных сторон в полуавтоматическом режиме хитро проверять на неожиданные уязвимости) Удаление, конечно, не спасёт от мотивированных энтузиастов. Утекло так утекло.

На практике - любой утёкший код это повод для пиар скандалов.

При этом речь может идти и про какие-то вещи, которые реально не хотелось бы показывать (чисто пофантазировать - представьте, отдельный прямо кусок с продуманной архитектурой для каких-нибудь нехороших штук связанных с трёхбуквенными агенствами и политикой).

Просто глупые вещи (чисто пофантазировать - представьте, что какая-нибудь вписанная на скорую руку фича связанная с банами/шедоубанами будет контроллироваться конфигом с названием stupid_thump_mode).

А может идти про какие-нибудь абсолютно нерелеватные вещи, при раздутия которых сообществом объяснять их нерелевантность будет уже поздно (тоже чисто пофанатизировать - представьте какие-нибудь ручки для подмены / чистки / подстановки задним числом сообщений, которые доступны, к примеру, тольк в тестовом окружении и нужны, собственно, для интеграционного тестирования. Удачи объяснять в комментариях к сенсационным новостям, что ручку на проде дёрнуть не получится).

Надо называть каждого так, как он себя идентифицирует

А magnet ни у кого не завалялось?

Приятно наблюдать, как гениальный руководитель ведёт компанию к оглушительному успеху!

Капзда скоро птичке. С таким руководителем - тем более. Маск не уважает работников - работники бунтуют. В этой статье описан один из примеров.

Раньше многие считали этого человека гением, но, мне кажется, его "гениальность" переросла в идиотизм. То, что он вытворяет сейчас - истинное лицо этой "гениальности".

По-моему, идиотизм это то, что птичка вообще взлетела. Наверное не было у меня более масштабного разочарования за последние 20 лет в человечестве, нежели тот факт, что человечество нашло идею твиттера и инстаграмма хоть сколько-нибудь стоящими и полезными.

А вдруг у Маска такой хитрый план — уничтожить твиттер?

НЛО прилетело и опубликовало эту надпись здесь

Суть именно в "уничтожить как явление".

Раньше многие считали этого человека гением, но, мне кажется, его "гениальность" переросла в идиотизм. То, что он вытворяет сейчас - истинное лицо этой "гениальности".

Очень часто мы "гениальность" с везением путаем. А потом какое-то время по инерции не хотим в это поверить, но потом осознание этого приходит. Это в экономие, также и в политике, когда цари или президенты "долгое" время считаются гениальными стратегами, что за чтобы они не взялись - всё у них получается. Но как и везде - это просто везение. И этому везению всегда придёт конец.

Я как-то в том же Твиттере влез в дискуссию на эту тему. Сошлись на такой мысли: Маску удаются продукты, у которых есть явный момент выпуска и получения денег от клиента сразу за всё.

Но он катастрофически не умеет работать с сервисами - то есть такими продуктами, прибыльность которых напрямую зависит от регулярного использования, и от которых пользователь может отказаться в любой момент.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости

Истории